找回密码
 注册

QQ登录

只需一步,快速开始

查看: 1446|回复: 10

大数据有哪些经典的应用案例?

[复制链接]
发表于 2021-12-7 12:25:17 | 显示全部楼层 |阅读模式
50款大数据的经典应用案例
1. 梅西百货的实时定价机制。根据需求和库存的情况,该公司基于SAS的系统对多达7300万种货品进行实时调价。
2. Tipp24 AG针对欧洲博彩业构建的下注和预测平台。该公司用KXEN软件来分析数十亿计的交易以及客户的特性,然后通过预测模型对特定用户进行动态的营销活动。这项举措减少了90%的预测模型构建时间。SAP公司正在试图收购KXEN。
3. 沃尔玛的搜索。这家零售业寡头为其网站http://Walmart.com自行设计了最新的搜索引擎Polaris,利用语义数据进行文本分析、机器学习和同义词挖掘等。根据沃尔玛的说法,语义搜索技术的运用使得在线购物的完成率提升了10%到15%。“对沃尔玛来说,这就意味着数十亿美元的金额。”Laney说。
4. 快餐业的视频分析。该公司通过视频分析等候队列的长度,然后自动变化电子菜单显示的内容。如果队列较长,则显示可以快速供给的食物;如果队列较短,则显示那些利润较高但准备时间相对长的食品。
5. Morton牛排店的品牌认知。当一位顾客开玩笑地通过推特向这家位于芝加哥的牛排连锁店订餐送到纽约Newark机场(他将在一天工作之后抵达该处)时,Morton就开始了自己的社交秀。首先,分析推特数据,发现该顾客是本店的常客,也是推特的常用者。根据客户以往的订单,推测出其所乘的航班,然后派出一位身着燕尾服的侍者为客户提供晚餐。
6. PredPol Inc.。PredPol公司通过与洛杉矶和圣克鲁斯的警方以及一群研究人员合作,基于地震预测算法的变体和犯罪数据来预测犯罪发生的几率,可以精确到500平方英尺的范围内。在洛杉矶运用该算法的地区,盗窃罪和暴力犯罪分布下降了33%和21%。
7. Tesco PLC(特易购)和运营效率。这家超市连锁在其数据仓库中收集了700万部冰箱的数据。通过对这些数据的分析,进行更全面的监控并进行主动的维修以降低整体能耗。
8. American Express(美国运通,AmEx)和商业智能。以往,AmEx只能实现事后诸葛式的报告和滞后的预测。“传统的BI已经无法满足业务发展的需要。”Laney认为。于是,AmEx开始构建真正能够预测忠诚度的模型,基于历史交易数据,用115个变量来进行分析预测。该公司表示,对于澳大利亚将于之后四个月中流失的客户,已经能够识别出其中的24%。
9、Espresso作为一个事务一致性文件存储。 LinkedIn建成的一个最重要的数据库是Espresso,通过对整个公司的网络操作将取代遗留的Oracle数据库。它最初的设计就是为了提供LinkedIn InMail消息服务的可用性。
10、Seton Healthcare是采用IBM最新沃森技术医疗保健内容分析预测的首个客户。该技术允许企业找到大量病人相关的临床医疗信息,通过大数据处理,更好地分析病人的信息。在加拿大多伦多的一家医院,针对早产婴儿,每秒钟有超过3000次的数据读取。通过这些数据分析,医院能够提前知道哪些早产儿出现问题并且有针对性地采取措施,避免早产婴儿夭折。
11、Express Scripts药物管理服务。通过一些复杂模型来检测虚假药品,这些模型还能及时提醒人们何时应该停止用药。
12、保险行业基于MongoDB的应用程序。MongoDB汇聚了来自70多个遗留系统的数据,并将它合并成一个单一的记录。它运行在两个数据中心的6个服务器上,目前存储了24TB的数据。这包括MetLife的全部美国客户,尽管它的目标是扩大它的国际客户和多种语言,同时也可能创建一个面向客户的版本。它的更新几乎是实时的,当新客户的数据输入时,就好像Facebook墙一样。
13、职业篮球赛。来自Krossover团队根据教练上传的每场比赛过后的视频将其分解,等到第二天教练再看昨晚的比赛时,他只需检查任何他想要的——数据统计、比赛中的个人表现、比赛反应等等。通过分析比赛视频,毫不夸张地分析所有的可量化的数据。
14、中医智慧养生。基于探码大数据的中医智慧养生平台是研究开发一套中医药特色的养生智能自助系统,该系统通过计算机信息技术、模糊数学理论和中医药理论,结合中医证型和中医体质学,通过智能养生系统,整合中医界著名专家的研究和临床经验,收录海量的各种中医体质信息和调试调理方式。用户输入自己的当前状态,系统根据这些输入信息,判断用户属于哪种不同的证型和体质,对用户给出中医药为主的包括,心理调适,运动养生,音乐调理,药食药膳,生活起居等各方面建议和初期诊断。
15、维斯塔斯风力系统。依靠的是BigInsights软件和IBM超级计算机,然后对气象数据进行分析,找出安装风力涡轮机和整个风电场最佳的地点。
16、印度Satyamev jayate电视节目。该节目整理并分析社会民众关于争议话题的各种意见,包括女性堕胎、种姓歧视和虐待儿童等社会热点问题,并使用这些数据来推进政治改革。
17、Facebook。Facebook联合创始人,克里斯休斯就建议扎克伯格在网站上推出相关服务,帮助总统候选人在Facebook上建立个人主页,以便他们进行形象推广。
18、MailChimp的电子邮件服务。MailChimp的一个重要任务就是搞清楚如何帮助客户更好地了解他们所发送的信息。考虑到这一点,该公司建立了一个服务叫Wavelength,向客户展示了与他们相似的其他讯息。这个系统使得Wavelength能够储存公司数据库中每个邮件地址发生的互动。这意味着告诉了你,用户打开了什么样的邮件,何时打开,他们点击了什么链接,还有订阅了什么邮件。
19、音乐元数据公司Gracenote。 Gracenote拥有数百万首歌曲的音频和元数据,因而可以快速识别歌曲信息,并按音乐风格、歌手、地理位置等分类。
20、全球零售业巨头沃尔玛啤酒+尿布。全球零售业巨头沃尔玛在对消费者购物行为分析时发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒来犒劳自己,于是尝试推出了将啤酒和尿布摆在一起的促销手段。没想到这个举措居然 使尿布和啤酒的销量都大幅增加了。如今,“啤酒+尿布”的数据分析成果早已成了大数据技术应用的经典案例,被人津津乐道。
21、数新闻让英国撤军。2010年10月23日《卫报》利用维基解密的数据做了一篇“数据新闻”。将伊拉克战争中所有的人员伤亡情况均标注于地图之上。地图上一个红点便代表一次死伤事件,鼠标点击红点后弹出的窗口则有详细的说明:伤亡人数、时间,造成伤亡的具体原因。密布的红点多达39万,显得格外触目惊心。一经刊出立即引起朝野震动,推动英国最终做出撤出驻伊拉克军队的决定。
22、QQ圈子把前女友推荐给未婚妻。2012年3月腾讯推出QQ圈子,按共同好友的连锁反应摊开用户的人际关系网,把用户的前女友推荐给未婚妻,把同学同事朋友圈子分门别类,利用大数据处理能力给人带来“震撼”。
23、Google成功预测冬季流感。2009年,Google通过分析5000万条美国人最频繁检索的词汇,将之和美国疾病中心在2003年到2008年间季节性流感传播时期的数据进行比较,并建立一个特定的数学模型。最终google成功预测了2009冬季流感的传播甚至可以具体到特定的地区和州。
24、XO Communications通过使用IBM SPSS预测分析软件,减少了将近一半的客户流失率。XO现在可以预测客户的行为,发现行为趋势,并找出存在缺陷的环节,从而帮助公司及时采取措施,保留客户。此外,IBM新的Netezza网络分析加速器,将通过提供单个端到端网络、服务、客户分析视图的可扩展平台,帮助通信企业制定更科学、合理决策。
25、电信业者透过数以千万计的客户资料,能分析出多种使用者行为和趋势,卖给需要的企业,这是全新的资料经济。   
26、中国移动通过大数据分析,对企业运营的全业务进行针对性的监控、预警、跟踪。系统在第一时间自动捕捉市场变化,再以最快捷的方式推送给指定负责人,使他在最短时间内获知市场行情。   
27、NTT docomo把手机位置信息和互联网上的信息结合起来,为顾客提供附近的餐饮店信息,接近末班车时间时,提供末班车信息服务。
28、浪潮GS助力广安集团一猪一ID强化食品安全。作为辐射全国的农牧企业集团,多年来广安集团一直企业信息化进程与企业发展需求不匹配的问题。2013年,广安集团引入浪潮GS,采用单件管理系统,通过一猪一ID对其成长周期进行全过程监控,促使食品安全可追溯,实现饲养流程精细化、集约化管理,使每年饲料节约了2成左右,为广安的智慧企业养成之路奠定了基础。
29、济南借力IBM 加快”智慧旅游”。济南正在推进智慧化旅游公共服务平台建设,借助IBM创建的智慧旅游成熟度评估模型,根据自身旅游业所处的发展阶段,以及济南旅游业实现跨越式发展所需要采取的具体行动,加快济南打造国际旅游名城的脚步。IBM正是利用大数据平台实现各旅游部门的信息共享,为行业管理、规范市场运作提供数据支撑。在对游客数据进行分析的基础上对游客群体进行细分,针对每一群体制定有针对性的营销策略。
30、Informatica帮助紫金农商银行深挖数据价值。紫金农商银行ODS数据仓库项目建设使用Informatica产品完成数据的加载、清洗、转换工作显得尤为简单,图形化、流程化设计使维护人员能够快速、顺畅的操作,即使数据源结构发生变化,也不会像以前必须修改大量的程序代码,只需要在PowerCenter中配置一下即可。
31、华为大数据方案在福建移动的应用。为进一步提升外呼成功率,从2014年初开始,福建移动联合华为公司开展基于大数据的精准营销工作,采用大数据分析的方法选择外呼目标价值用户。基于大数据分析方法和传统外呼方法分别提供20万目标客户清单,在前台无感知下进行对比验证,确保对比效果不受人为因素影响,经过外呼验证,基于大数据分析方法较传统方法外呼成功率提升50%以上,有效支撑了福建移动4G用户发展战略。
32、神州数码助张家港市更”智慧”。在张家港实践的城市案例中,市民登录这款”神州数码”研发的市民公共信息服务平台后,市民只要凭借自己的身份证和密码,即可通过该系统平台进行240余项”在线预审”服务、130余项”网上办事”服务等,还可通过手机及时查看办事状态。相比于以前来说,市民办事的时间最少可以节省一半以上。
33、软通动力大数据平台为政府以及企业提供舆情监控服务。基于大数据、云计算等新兴技术手段,软通动力信息技术(集团)有限公司于2014年推出了大数据舆情监测平台产品,为政府以及企业提供舆情监控服务。大数据舆情监测平台提供的”企业画像”功能,是专为企业打造的一个便捷智能分析产品。”企业画像”通过对企业市场、客户、产品、业务等海量信息出发,通过多角度分析和智能挖掘来构建一系列可视化数据,致力于帮助企业发现大数据中隐藏的价值和商机。
34、宜信宜人贷用大数据突破”极速模式”。利用大数据技术,宜信金融云能够解决金融领域海量数据的存储、查询优化,及声音、影像等非结构化数据的处理。一方面对数据进行可视化,构建客户画像,便于专家分析;另一方面结合专家知识和机器学习模型,实现规则引擎、授信引擎和反欺诈引擎等模块,有效地支持了宜信的在线和离线业务,完成对用户的实时授信。宜信宜人贷”极速模式”可以做到在手机端和PC端提交资料之后,10分钟内反馈审核结果,最低月费率0.78%,最高额度为10万元,最快在一天内资金到账。如此快速审核的背后,就是大数据金融云的功劳
35、星环TDH助力山东交警办案更高效。公安部无锡所帮助山东交警部署的新缉查系统底层采用了星环科技的分布式大数据处理平台Transwarp Data Hub(TDH)。
36、农夫山泉运用SAP HANA实时处理海量数据。利用SAPHANA的触发机制,农夫山泉实现了真正的实时数据转移及数据同步。这样的实时数据同步使得数据分析能够更及时,也为业务人员带来极大的便利,使得他们所做出的分析及市场反应能够更及时准确,也能减少错误的发生。
37、京东用大数据技术勾勒用户画像。用户画像提供统一数据服务接口供网站其他产品调用,提高与用户间的沟通效率、提升用户体验。比如提供给推荐搜索调用,针对不同用户属性特征、性格特点或行为习惯在他搜索或点击时展示符合该用户特点和偏好的商品,给用户以友好舒适的购买体验,能很大程度上提高用户的购买转化率甚至重复购买,对提高用户忠诚度和用户黏性有很大帮助;再比如数据接口提供给网站智能机器人JIMI,可以基于用户画像的用户量身定做咨询应答策略,如快速理解用户意图、针对性商品评测或商品推荐、个性化关怀等,大幅提升JIMI 智能水平和服务力度,赢得用户欢迎和肯定。
38、Oracle零售解决方案助北京华联集团优化运营管理。作为中国商务部重点扶持的最大零售企业之一,北京华联集团通过部署Oracle 零售应用解决方案,以优化运营管理,进而提高商业敏捷性,并提升关键货物、定价、存货、供应链和交易流程的管理和实施。全面支持其旗下各项业务的不断增长,包括大卖场、综合超市、百货公司以及商业地产等。
39、IBM助广州中医药大学第一附属医院开启智能化数据分析。利用IBM大数据分析工具,广州中医药大学第一附属医院实现了医院在日常运营监控、阳光用药监察、医保费用监控、科室目标管理四大方面的有效提升。利用IBM大数据分析工具Cognos和数据挖掘工具Datastage构建的医院智能运营平台,能够帮助医院进行日常运营信息的整合,对复杂的数据源进行数据抽取、清洗和转换,为数据的智能化分析利用打好基础。
40、美特斯邦威借SQL Server优化管理与运营。美特斯邦威作为中国销售量最大的服饰品牌之一,其集团也在积极寻求如何利用大数据在线上线下实现零售业务增长。借助微软SQL Server 2012商业解决方案,美特斯邦威能够掌握客户店内走动情况以及与商品的互动,将丰富的输入数据与交易记录相结合开展实验,以便指导销售哪些商品、摆放货品以及如何以及何时调整售价与优化库存。
41、安徽农信采用IBM i平台有效控制金融风险。安徽省农村信用社联合社采用IBM i平台,通过规模化经营提升竞争力并有效控制金融风险。i平台在稳定性、安全性方面的优势,整体虚拟化设计和面向云、智能化的设计能为安徽农信带来更多的投资回报,并提供了面向未来应用需求的IT基础架构。
42.腾讯大数据发布世界杯报告《移动端上的世界杯》腾讯大数据发布巴西世界杯主题报告《移动端上的世界杯》。报告从足球迷使用机型、移动端活跃用户数分布、性别、年龄、地域等多个维度进行了分析。并且移动端互动性良好,热度很高。报告指出,世界杯期间用户主要通过小米手机、苹果手机和三星手机了解世界杯的最新消息。并且玩家通过微信邀请好友移动猜球、选择球迷最喜爱的球员和球队,用户活跃度高于平时。
43.爱奇艺大数据分析工具绿镜通过收集、分析用户对于《高科技少女喵》每一分钟收视喜好乃至用户对每个内容片段的不同反应,协助创作方对剧集进行优化,也让网络播放量直线飙升。新鲜创意的不断尝试给观众带来了与众不同的体验,用户对此类剧的热忱正与日俱增。
44.韩国观光公社与百度合作利用大数据吸引中国游客。由于最近几年的韩流袭来,韩国成为越来越多中国游客的旅游目的地。韩国观光公社将与百度合作,利用百度关于旅游交通的移动流量数据来吸引更多中国的游客。百度将会提供给韩国观光公社以与旅游相关的数据,来帮助其对需求进行科学分析,并据此结果制定市场策略。
45.软通动力助推成都智慧旅游数据中心建设。软通动力在充分借鉴国内外旅游数据中心建设的成功经验的基础上,结合成都旅游信息化发展现状和未来智慧旅游对数据支撑的要求,提供定制化的解决方案,并最终成功开发建设了标准统一、资源共享、接口开放、与旅游产业发展相适应的数据中心管理系统,使得成都市的旅游服务、旅游营销及旅游管理达到了一个全新的境界,让城市旅游更加智慧化、个性化和便捷化。
46.华为ICT助力海南建设国际化的智慧旅游岛。华为企业ICT解决方案在海南各行业已广泛应用,服务于包括海南省委、海南省政府、海南省公安厅、海南电网、海南省气象局、工商银行和农业银行等银行在海南省的分行等多家客户。华为携手海南蓝点计算机网络工程有限公司共同为海南智慧旅游岛的建设,提供更优质的产品和服务,助力海南提高信息化核心竞争力。
47.汉庭酒店成功实施全面预算解决方案。利用IBM大数据分析工具,汉庭酒店成功实施全面预算解决方案,帮助企业财务部门将预算周期缩短了60%,年度战略规划的工作时间缩短了90%,推动了集团业务创新拓展。IBM Cognos能够灵活地调整动态预测信息分析和实现即时分析计算,提升了预算业务流程的效率和数据质量;使得汉庭财务部门能够加强预算编制、调整流程控制,缩短工作周期时间,从而更好地发挥部门智能;通过高效准确、以业务为导向的预算规划,为集团业务的快速拓展提供强大支持。
48、阿迪达斯的“黄金罗盘”。阿迪达斯每天都会收集门店的销售数据,并将它们上传至阿迪达斯。收到数据后,阿迪达斯对数据做整合、分析,再用于指导经销商卖货。研究这些数据,让阿迪达斯和经销商们可以更准确了解当地消费者对商品颜色、款式、功能的偏好,同时知道什么价位的产品更容易被接受。
49、数据权之争。最近几年,随着移动互联网的兴起,一类关于航班动态的应用程序开始出现。飞友网络通过一套算法,数据工程师们将机场航班实时动态转换成直观的信息,再传递给用户,让后者能够及时了解到航班的起飞、到达、延误、取消、返航、备降等状态,从而帮助用户更高效地安排行程计划。
50、投融资并购交易大数据平台。这是一款由探码科技基于Web大数据采集系统研发的,一款基于数据挖掘技术的推荐引擎产品,是国内最全的提供增资扩股、股权转让交易信息的大数据平台。该平台通过大数据采集、过滤、存储、可视化建立引流的桥,吸引融资供应者投资人到该平台,将项目智能推送给有效投资人,为投资机构提供寻找项目的效率工具,为企业提供有效的投资人对接通道,助力企业投融资并购的开展。同时,在项目可行性研究的基础上,吸收国内外投资项目分析评价的理论和方法,利用丰富的资料和数据,定性和定量相结合,对投资项目的价值进行全面的分析评估,自主研发了一套企业评价系统。
发表于 2021-12-7 12:26:02 | 显示全部楼层
50款大数据的经典应用案例
1. 梅西百货的实时定价机制。根据需求和库存的情况,该公司基于SAS的系统对多达7300万种货品进行实时调价。
2. Tipp24 AG针对欧洲博彩业构建的下注和预测平台。该公司用KXEN软件来分析数十亿计的交易以及客户的特性,然后通过预测模型对特定用户进行动态的营销活动。这项举措减少了90%的预测模型构建时间。SAP公司正在试图收购KXEN。
3. 沃尔玛的搜索。这家零售业寡头为其网站http://Walmart.com自行设计了最新的搜索引擎Polaris,利用语义数据进行文本分析、机器学习和同义词挖掘等。根据沃尔玛的说法,语义搜索技术的运用使得在线购物的完成率提升了10%到15%。“对沃尔玛来说,这就意味着数十亿美元的金额。”Laney说。
4. 快餐业的视频分析。该公司通过视频分析等候队列的长度,然后自动变化电子菜单显示的内容。如果队列较长,则显示可以快速供给的食物;如果队列较短,则显示那些利润较高但准备时间相对长的食品。
5. Morton牛排店的品牌认知。当一位顾客开玩笑地通过推特向这家位于芝加哥的牛排连锁店订餐送到纽约Newark机场(他将在一天工作之后抵达该处)时,Morton就开始了自己的社交秀。首先,分析推特数据,发现该顾客是本店的常客,也是推特的常用者。根据客户以往的订单,推测出其所乘的航班,然后派出一位身着燕尾服的侍者为客户提供晚餐。
6. PredPol Inc.。PredPol公司通过与洛杉矶和圣克鲁斯的警方以及一群研究人员合作,基于地震预测算法的变体和犯罪数据来预测犯罪发生的几率,可以精确到500平方英尺的范围内。在洛杉矶运用该算法的地区,盗窃罪和暴力犯罪分布下降了33%和21%。
7. Tesco PLC(特易购)和运营效率。这家超市连锁在其数据仓库中收集了700万部冰箱的数据。通过对这些数据的分析,进行更全面的监控并进行主动的维修以降低整体能耗。
8. American Express(美国运通,AmEx)和商业智能。以往,AmEx只能实现事后诸葛式的报告和滞后的预测。“传统的BI已经无法满足业务发展的需要。”Laney认为。于是,AmEx开始构建真正能够预测忠诚度的模型,基于历史交易数据,用115个变量来进行分析预测。该公司表示,对于澳大利亚将于之后四个月中流失的客户,已经能够识别出其中的24%。
9、Espresso作为一个事务一致性文件存储。 LinkedIn建成的一个最重要的数据库是Espresso,通过对整个公司的网络操作将取代遗留的Oracle数据库。它最初的设计就是为了提供LinkedIn InMail消息服务的可用性。
10、Seton Healthcare是采用IBM最新沃森技术医疗保健内容分析预测的首个客户。该技术允许企业找到大量病人相关的临床医疗信息,通过大数据处理,更好地分析病人的信息。在加拿大多伦多的一家医院,针对早产婴儿,每秒钟有超过3000次的数据读取。通过这些数据分析,医院能够提前知道哪些早产儿出现问题并且有针对性地采取措施,避免早产婴儿夭折。
11、Express Scripts药物管理服务。通过一些复杂模型来检测虚假药品,这些模型还能及时提醒人们何时应该停止用药。
12、保险行业基于MongoDB的应用程序。MongoDB汇聚了来自70多个遗留系统的数据,并将它合并成一个单一的记录。它运行在两个数据中心的6个服务器上,目前存储了24TB的数据。这包括MetLife的全部美国客户,尽管它的目标是扩大它的国际客户和多种语言,同时也可能创建一个面向客户的版本。它的更新几乎是实时的,当新客户的数据输入时,就好像Facebook墙一样。
13、职业篮球赛。来自Krossover团队根据教练上传的每场比赛过后的视频将其分解,等到第二天教练再看昨晚的比赛时,他只需检查任何他想要的——数据统计、比赛中的个人表现、比赛反应等等。通过分析比赛视频,毫不夸张地分析所有的可量化的数据。
14、中医智慧养生。基于探码大数据的中医智慧养生平台是研究开发一套中医药特色的养生智能自助系统,该系统通过计算机信息技术、模糊数学理论和中医药理论,结合中医证型和中医体质学,通过智能养生系统,整合中医界著名专家的研究和临床经验,收录海量的各种中医体质信息和调试调理方式。用户输入自己的当前状态,系统根据这些输入信息,判断用户属于哪种不同的证型和体质,对用户给出中医药为主的包括,心理调适,运动养生,音乐调理,药食药膳,生活起居等各方面建议和初期诊断。
15、维斯塔斯风力系统。依靠的是BigInsights软件和IBM超级计算机,然后对气象数据进行分析,找出安装风力涡轮机和整个风电场最佳的地点。
16、印度Satyamev jayate电视节目。该节目整理并分析社会民众关于争议话题的各种意见,包括女性堕胎、种姓歧视和虐待儿童等社会热点问题,并使用这些数据来推进政治改革。
17、Facebook。Facebook联合创始人,克里斯休斯就建议扎克伯格在网站上推出相关服务,帮助总统候选人在Facebook上建立个人主页,以便他们进行形象推广。
18、MailChimp的电子邮件服务。MailChimp的一个重要任务就是搞清楚如何帮助客户更好地了解他们所发送的信息。考虑到这一点,该公司建立了一个服务叫Wavelength,向客户展示了与他们相似的其他讯息。这个系统使得Wavelength能够储存公司数据库中每个邮件地址发生的互动。这意味着告诉了你,用户打开了什么样的邮件,何时打开,他们点击了什么链接,还有订阅了什么邮件。
19、音乐元数据公司Gracenote。 Gracenote拥有数百万首歌曲的音频和元数据,因而可以快速识别歌曲信息,并按音乐风格、歌手、地理位置等分类。
20、全球零售业巨头沃尔玛啤酒+尿布。全球零售业巨头沃尔玛在对消费者购物行为分析时发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒来犒劳自己,于是尝试推出了将啤酒和尿布摆在一起的促销手段。没想到这个举措居然 使尿布和啤酒的销量都大幅增加了。如今,“啤酒+尿布”的数据分析成果早已成了大数据技术应用的经典案例,被人津津乐道。
21、数据新闻让英国撤军。2010年10月23日《卫报》利用维基解密的数据做了一篇“数据新闻”。将伊拉克战争中所有的人员伤亡情况均标注于地图之上。地图上一个红点便代表一次死伤事件,鼠标点击红点后弹出的窗口则有详细的说明:伤亡人数、时间,造成伤亡的具体原因。密布的红点多达39万,显得格外触目惊心。一经刊出立即引起朝野震动,推动英国最终做出撤出驻伊拉克军队的决定。
22、QQ圈子把前女友推荐给未婚妻。2012年3月腾讯推出QQ圈子,按共同好友的连锁反应摊开用户的人际关系网,把用户的前女友推荐给未婚妻,把同学同事朋友圈子分门别类,利用大数据处理能力给人带来“震撼”。
23、Google成功预测冬季流感。2009年,Google通过分析5000万条美国人最频繁检索的词汇,将之和美国疾病中心在2003年到2008年间季节性流感传播时期的数据进行比较,并建立一个特定的数学模型。最终google成功预测了2009冬季流感的传播甚至可以具体到特定的地区和州。
24、XO Communications通过使用IBM SPSS预测分析软件,减少了将近一半的客户流失率。XO现在可以预测客户的行为,发现行为趋势,并找出存在缺陷的环节,从而帮助公司及时采取措施,保留客户。此外,IBM新的Netezza网络分析加速器,将通过提供单个端到端网络、服务、客户分析视图的可扩展平台,帮助通信企业制定更科学、合理决策。
25、电信业者透过数以千万计的客户资料,能分析出多种使用者行为和趋势,卖给需要的企业,这是全新的资料经济。   
26、中国移动通过大数据分析,对企业运营的全业务进行针对性的监控、预警、跟踪。系统在第一时间自动捕捉市场变化,再以最快捷的方式推送给指定负责人,使他在最短时间内获知市场行情。   
27、NTT docomo把手机位置信息和互联网上的信息结合起来,为顾客提供附近的餐饮店信息,接近末班车时间时,提供末班车信息服务。
28、浪潮GS助力广安集团一猪一ID强化食品安全。作为辐射全国的农牧企业集团,多年来广安集团一直企业信息化进程与企业发展需求不匹配的问题。2013年,广安集团引入浪潮GS,采用单件管理系统,通过一猪一ID对其成长周期进行全过程监控,促使食品安全可追溯,实现饲养流程精细化、集约化管理,使每年饲料节约了2成左右,为广安的智慧企业养成之路奠定了基础。
29、济南借力IBM 加快”智慧旅游”。济南正在推进智慧化旅游公共服务平台建设,借助IBM创建的智慧旅游成熟度评估模型,根据自身旅游业所处的发展阶段,以及济南旅游业实现跨越式发展所需要采取的具体行动,加快济南打造国际旅游名城的脚步。IBM正是利用大数据平台实现各旅游部门的信息共享,为行业管理、规范市场运作提供数据支撑。在对游客数据进行分析的基础上对游客群体进行细分,针对每一群体制定有针对性的营销策略。
30、Informatica帮助紫金农商银行深挖数据价值。紫金农商银行ODS数据仓库项目建设使用Informatica产品完成数据的加载、清洗、转换工作显得尤为简单,图形化、流程化设计使维护人员能够快速、顺畅的操作,即使数据源结构发生变化,也不会像以前必须修改大量的程序代码,只需要在PowerCenter中配置一下即可。
31、华为大数据方案在福建移动的应用。为进一步提升外呼成功率,从2014年初开始,福建移动联合华为公司开展基于大数据的精准营销工作,采用大数据分析的方法选择外呼目标价值用户。基于大数据分析方法和传统外呼方法分别提供20万目标客户清单,在前台无感知下进行对比验证,确保对比效果不受人为因素影响,经过外呼验证,基于大数据分析方法较传统方法外呼成功率提升50%以上,有效支撑了福建移动4G用户发展战略。
32、神州数码助张家港市更”智慧”。在张家港实践的城市案例中,市民登录这款”神州数码”研发的市民公共信息服务平台后,市民只要凭借自己的身份证和密码,即可通过该系统平台进行240余项”在线预审”服务、130余项”网上办事”服务等,还可通过手机及时查看办事状态。相比于以前来说,市民办事的时间最少可以节省一半以上。
33、软通动力大数据平台为政府以及企业提供舆情监控服务。基于大数据、云计算等新兴技术手段,软通动力信息技术(集团)有限公司于2014年推出了大数据舆情监测平台产品,为政府以及企业提供舆情监控服务。大数据舆情监测平台提供的”企业画像”功能,是专为企业打造的一个便捷智能分析产品。”企业画像”通过对企业市场、客户、产品、业务等海量信息出发,通过多角度分析和智能挖掘来构建一系列可视化数据,致力于帮助企业发现大数据中隐藏的价值和商机。
34、宜信宜人贷用大数据突破”极速模式”。利用大数据技术,宜信金融云能够解决金融领域海量数据的存储、查询优化,及声音、影像等非结构化数据的处理。一方面对数据进行可视化,构建客户画像,便于专家分析;另一方面结合专家知识和机器学习模型,实现规则引擎、授信引擎和反欺诈引擎等模块,有效地支持了宜信的在线和离线业务,完成对用户的实时授信。宜信宜人贷”极速模式”可以做到在手机端和PC端提交资料之后,10分钟内反馈审核结果,最低月费率0.78%,最高额度为10万元,最快在一天内资金到账。如此快速审核的背后,就是大数据金融云的功劳
35、星环TDH助力山东交警办案更高效。公安部无锡所帮助山东交警部署的新缉查系统底层采用了星环科技的分布式大数据处理平台Transwarp Data Hub(TDH)。
36、农夫山泉运用SAP HANA实时处理海量数据。利用SAPHANA的触发机制,农夫山泉实现了真正的实时数据转移及数据同步。这样的实时数据同步使得数据分析能够更及时,也为业务人员带来极大的便利,使得他们所做出的分析及市场反应能够更及时准确,也能减少错误的发生。
37、京东用大数据技术勾勒用户画像。用户画像提供统一数据服务接口供网站其他产品调用,提高与用户间的沟通效率、提升用户体验。比如提供给推荐搜索调用,针对不同用户属性特征、性格特点或行为习惯在他搜索或点击时展示符合该用户特点和偏好的商品,给用户以友好舒适的购买体验,能很大程度上提高用户的购买转化率甚至重复购买,对提高用户忠诚度和用户黏性有很大帮助;再比如数据接口提供给网站智能机器人JIMI,可以基于用户画像的用户量身定做咨询应答策略,如快速理解用户意图、针对性商品评测或商品推荐、个性化关怀等,大幅提升JIMI 智能水平和服务力度,赢得用户欢迎和肯定。
38、Oracle零售解决方案助北京华联集团优化运营管理。作为中国商务部重点扶持的最大零售企业之一,北京华联集团通过部署Oracle 零售应用解决方案,以优化运营管理,进而提高商业敏捷性,并提升关键货物、定价、存货、供应链和交易流程的管理和实施。全面支持其旗下各项业务的不断增长,包括大卖场、综合超市、百货公司以及商业地产等。
39、IBM助广州中医药大学第一附属医院开启智能化数据分析。利用IBM大数据分析工具,广州中医药大学第一附属医院实现了医院在日常运营监控、阳光用药监察、医保费用监控、科室目标管理四大方面的有效提升。利用IBM大数据分析工具Cognos和数据挖掘工具Datastage构建的医院智能运营平台,能够帮助医院进行日常运营信息的整合,对复杂的数据源进行数据抽取、清洗和转换,为数据的智能化分析利用打好基础。
40、美特斯邦威借SQL Server优化管理与运营。美特斯邦威作为中国销售量最大的服饰品牌之一,其集团也在积极寻求如何利用大数据在线上线下实现零售业务增长。借助微软SQL Server 2012商业解决方案,美特斯邦威能够掌握客户店内走动情况以及与商品的互动,将丰富的输入数据与交易记录相结合开展实验,以便指导销售哪些商品、摆放货品以及如何以及何时调整售价与优化库存。
41、安徽农信采用IBM i平台有效控制金融风险。安徽省农村信用社联合社采用IBM i平台,通过规模化经营提升竞争力并有效控制金融风险。i平台在稳定性、安全性方面的优势,整体虚拟化设计和面向云、智能化的设计能为安徽农信带来更多的投资回报,并提供了面向未来应用需求的IT基础架构。
42.腾讯大数据发布世界杯报告《移动端上的世界杯》腾讯大数据发布巴西世界杯主题报告《移动端上的世界杯》。报告从足球迷使用机型、移动端活跃用户数分布、性别、年龄、地域等多个维度进行了分析。并且移动端互动性良好,热度很高。报告指出,世界杯期间用户主要通过小米手机、苹果手机和三星手机了解世界杯的最新消息。并且玩家通过微信邀请好友移动猜球、选择球迷最喜爱的球员和球队,用户活跃度高于平时。
43.爱奇艺大数据分析工具绿镜通过收集、分析用户对于《高科技少女喵》每一分钟收视喜好乃至用户对每个内容片段的不同反应,协助创作方对剧集进行优化,也让网络播放量直线飙升。新鲜创意的不断尝试给观众带来了与众不同的体验,用户对此类剧的热忱正与日俱增。
44.韩国观光公社与百度合作利用大数据吸引中国游客。由于最近几年的韩流袭来,韩国成为越来越多中国游客的旅游目的地。韩国观光公社将与百度合作,利用百度关于旅游交通的移动流量数据来吸引更多中国的游客。百度将会提供给韩国观光公社以与旅游相关的数据,来帮助其对需求进行科学分析,并据此结果制定市场策略。
45.软通动力助推成都智慧旅游数据中心建设。软通动力在充分借鉴国内外旅游数据中心建设的成功经验的基础上,结合成都旅游信息化发展现状和未来智慧旅游对数据支撑的要求,提供定制化的解决方案,并最终成功开发建设了标准统一、资源共享、接口开放、与旅游产业发展相适应的数据中心管理系统,使得成都市的旅游服务、旅游营销及旅游管理达到了一个全新的境界,让城市旅游更加智慧化、个性化和便捷化。
46.华为ICT助力海南建设国际化的智慧旅游岛。华为企业ICT解决方案在海南各行业已广泛应用,服务于包括海南省委、海南省政府、海南省公安厅、海南电网、海南省气象局、工商银行和农业银行等银行在海南省的分行等多家客户。华为携手海南蓝点计算机网络工程有限公司共同为海南智慧旅游岛的建设,提供更优质的产品和服务,助力海南提高信息化核心竞争力。
47.汉庭酒店成功实施全面预算解决方案。利用IBM大数据分析工具,汉庭酒店成功实施全面预算解决方案,帮助企业财务部门将算周期缩短了60%,年度战略规划的工作时间缩短了90%,推动了集团业务创新拓展。IBM Cognos能够灵活地调整动态预测信息分析和实现即时分析计算,提升了预算业务流程的效率和数据质量;使得汉庭财务部门能够加强预算编制、调整流程控制,缩短工作周期时间,从而更好地发挥部门智能;通过高效准确、以业务为导向的预算规划,为集团业务的快速拓展提供强大支持。
48、阿迪达斯的“黄金罗盘”。阿迪达斯每天都会收集门店的销售数据,并将它们上传至阿迪达斯。收到数据后,阿迪达斯对数据做整合、分析,再用于指导经销商卖货。研究这些数据,让阿迪达斯和经销商们可以更准确了解当地消费者对商品颜色、款式、功能的偏好,同时知道什么价位的产品更容易被接受。
49、数据权之争。最近几年,随着移动互联网的兴起,一类关于航班动态的应用程序开始出现。飞友网络通过一套算法,数据工程师们将机场航班实时动态转换成直观的信息,再传递给用户,让后者能够及时了解到航班的起飞、到达、延误、取消、返航、备降等状态,从而帮助用户更高效地安排行程计划。
50、投融资并购交易大数据平台。这是一款由探码科技基于Web大数据采集系统研发的,一款基于数据挖掘技术的推荐引擎产品,是国内最全的提供增资扩股、股权转让交易信息的大数据平台。该平台通过大数据采集、过滤、存储、可视化建立引流的桥,吸引融资供应者投资人到该平台,将项目智能推送给有效投资人,为投资机构提供寻找项目的效率工具,为企业提供有效的投资人对接通道,助力企业投融资并购的开展。同时,在项目可行性研究的基础上,吸收国内外投资项目分析评价的理论和方法,利用丰富的资料和数据,定性和定量相结合,对投资项目的价值进行全面的分析评估,自主研发了一套企业评价系统。
发表于 2021-12-7 12:26:12 | 显示全部楼层
一个MIT的研究员去分析了一个英国的数据,通过数据的信息来看一个地区的经济变化。
大家都知道中国每十年做一次人口普查,费时费力,欧洲人员通过分析葡萄牙手机基站的数据,去做了人口密度的动态评估,可以看出人口的动态密度。
发表于 2021-12-7 12:26:41 | 显示全部楼层
大数据应用金典案例比较多,根据不同的行业其主要应用需求也不同,而在国内的金典案例中但几乎没有从自然语言处理和文本语义方面讲解的案例,为了日大家了解自然语言处理和文本语义技术,下面我分享一个语义智能分析方面的案例:电网语义精准搜索引擎系统挖掘案例。

电网语义精准搜索引擎系统是针对大数据垂直搜索需求的全文智能检索引擎,融合了自然语言理解、网络搜索和文本挖掘的技术,通过人机互动、深度机器学习后具有一定的语义推理能力,是结合了人工智能技术的新一代搜索引擎。

大数据有哪些经典的应用案例?-1.jpg
图1:系统首页
在搜索框输入你要查询的问题,搜索引擎通过人机互动、自然语言理解,对你输入的内容进行语义分析,读懂你的问题,提炼出问题主体,对搜索结果进行去重并推送精准结果。
搜索引擎在语义深度理解的基础上,并从数据库中通过深度语义算法算出与主题相关的信息,去除冗余、提取扼要信息,从而推送给客户一段精准的答案;此结果体现了传统搜索引擎为你“寻找”转变为为你“回答”的智能化搜索升级。
语义精准搜索引擎系统主要满足知识搜索、电网报、统计分析、语义技术、语义本体五大功能模块。以下介绍具体功能:
一、知识搜索
搜索引擎给出语义深度理解的功能外,还兼具图书文献类知识管理搜索功能,搜索框输入你要查询的关键词,搜索引擎通过人机互动、自然语言理解,对你输入的内容进行相关图书文献搜索,对搜索结果进行去重并推送精准结果。如搜索“智能电网”,直接展示出与关键词“智能电网”有关的文献和图书,目前系统内已经收录了数千部文献和图书,可以充分的满足搜索需求。如,搜索“智能电网”后的展现结果:

大数据有哪些经典的应用案例?-2.jpg
图2:文献图书类知识搜索
同时可以显示文献和图书进行相关性聚类分析,如下图红框中,可点击进行相关术语或相关作者的文献及图书的搜索,如图3所示:

大数据有哪些经典的应用案例?-3.jpg
图3:相关性聚类
且能查看关于“智能电网”的知识分布雷达图,展示如图4所示

大数据有哪些经典的应用案例?-4.jpg
图4: 知识分布雷达图
通过对搜索结果进行分析,对相关文献进行知识分类分析,建立起如图的关系,主节点为分类号,标准的分类体系,而每个节点下面为其相关的关键词,再通过其关键词建立起了类别的关系,有效的组织了知识的结构。
二: 电网报搜索
在搜索框输入你要查询的关键词或问题,搜索引擎通过人机互动、自然语言理解,对你输入的内容进行语义分析,读懂你的关键词或问题,提炼出主体,对搜索结果进行去重并推送精准结果。
如: 刘振*的老家在哪
搜索引擎经过机器对自然语言的理解直接分析出你询问对象的主体是“刘振*”然后搜索挖掘出精准答案推送给你。搜索结果如图5所示

大数据有哪些经典的应用案例?-5.jpg
图5: 搜索“刘振*的老家在哪”
搜索结果在线主题聚类是基于相似性算法的自动聚类技术,自动对大量无类别的文档进行归类,把内容相近的文档归为一类,自动为该类生成标题和主题词并统计出文章数。例如对搜索的 “智能电网”相关的文本进行聚类分类。并展示了与问题主题关联的其他主体结果。如,“智能电网”的聚类结果如图:6所示,

大数据有哪些经典的应用案例?-6.jpg
图6 :聚类结果
“智能电网”的语义结果展示如图7,

大数据有哪些经典的应用案例?-7.jpg
图7: 语义结果
点击“分析”按钮后,展示对“智能电网”的语义统计分析结果动态展示,如图8,语义搜索引擎通过语义分析,关键词提取,获取问题主体就时间变化的可视化图谱。此功能是根据时间轴通过文本的语义分析给出一个时序性动态的主题展示结果。图8中,右侧为分析对象说明,左侧为结果动态展示。下方展示搜索引擎对“智能电网”从2007年到2015年相关信息的搜索挖掘基于语义分析并呈现动态可视化的知识推送。

大数据有哪些经典的应用案例?-8.jpg
图8: 语义统计分析动态展示
搜索引擎在问题语义理解的基础上通过聚类技术对与主题相关文章进行聚类并统计出文章数量。每篇文章通过实体抽取、关键词提取等标注出文章来源、版块、发布时间、作者及这篇文章的关键词。
搜索引擎采用了实体抽取系统能够智能识别出文本中出现的人名、地名、机构名、媒体、作者及文章的主题关键词,这是对语言规律的深入理解和预测。而且其所提炼出的词语不需要在词典库中事先存在。另外,本功能统计出与实体相关的文章数量。图9中红框内相关人物聚类中显示与搜索问题相关的人物及文章数。

大数据有哪些经典的应用案例?-9.jpg
图9: 相关人物聚类
相关概念词发现和相关任务的计算的结果来自于对10年报纸数据的学习。机器学习算法在不对迭代的对10年报纸的数据学习过程中,形成了词与词之间的关联,从而构建出了类似于本体库的词关系网(词网),通过给定词来计算相近关系和相邻关系的词和人物。
三、 统计分析
搜索引擎不仅有知识管理及搜索功能,还能在后台进行统计分析,直接展示出分析结果,如图,搜索“智能电网”后“*网报信息来源地图“中的展示,由颜色深浅表示文章的相关来源城市出现的次数高低,蓝色约深表示相关文章来源城市出现频次高。以图10为例,“智能电网”相关文章在黑龙江、内蒙古、贵州、云南、广西、广东、海南、台湾等城市出现次数较少,说明这些城市还没有发展智能电网,可做电网人员的决策参考。

大数据有哪些经典的应用案例?-10.jpg
图10 :国网报信息来源地图
“智能电网”相关文章统计分析展示如图11,左饼图表示“智能电网”相关文章的作者统计分析,右边饼图表示“智能电网”相关文章所在版块的统计分析。

大数据有哪些经典的应用案例?-11.jpg
图:11:文章相关统计
同时展示“智能电网”2008-2015年期间的话题变化曲线情况,如图:12

大数据有哪些经典的应用案例?-12.jpg
图12:话题变化曲线
四、语义技术
语义技术部分展现的是后台的语义处理技术,包括概念发现、关联关系的建立和基于机器学习的关系计算,最红利用完善的本体库,进行语义计算。
(1)概念发现:通过给定词,来发现与其相近的新概念,这里表达出的是与其有关系,但是未对具体的关系做深入判断,所以成为概念发现。

大数据有哪些经典的应用案例?-13.jpg
图13:关键词概念
(2)概念关系推理:在发现概念之后,为了进一步推定其关系,这里采用了迭代的方法,在不断迭代发现与其相关概念的概念时,建立起了词与词的关系网,如图是经历了两次计算后的效果图,是词关系网建立的中间过程。

大数据有哪些经典的应用案例?-14.jpg
图14:概念关联推理
(3)关联关系计算:通过不断的迭代学习,最终形成的关系网络如图所示,在不管学习的过程中,相关概念不断的聚集,从而建立起了比较密切的关系,而这种关系通常是同位关系,也就是代项或参项等。

大数据有哪些经典的应用案例?-15.jpg
图15:关键词关联关系计算
(4)本体关系计算:同步上述三个步骤的处理,从而能够帮助本体库的完善,在少量专家的参与下,不断扩充本体库。如图是通过电力本体库计算得出的本体的关系图。

大数据有哪些经典的应用案例?-16.jpg
图16:搜索关键词本体关系
五、语义本体功能
语义精准搜索引擎通过实体抽取功能,在数据库中搜索挖掘出其中实体,规定各实体之间的关系类别,通过交叉信息熵计算每个实体的关联关系,从而建立整理的实体关系展示图谱。如下图,搜索引擎抽取出电力行业的实体概念,通过规定核心概念、用项、代项、分项、属项、族项、参项这六项关系,采用一定算法建立实体之间的关系,从而建立整个实体的关系关联展示图。

大数据有哪些经典的应用案例?-17.jpg
图17:语义本体功能图
以上案例是大数据智能语义文本方面的案例分享,希望可以对您有所帮助。其案例技术是使用了北京理工大学大数据搜索与挖掘实验室张华平主任研发的NLPIR大数据语义智能分析技术平台实现的,如果感兴趣可以了解一下!
头像被屏蔽
发表于 2021-12-7 12:27:06 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2021-12-7 12:28:00 | 显示全部楼层
大数据有哪些经典的应用案例?-1.jpg
发表于 2021-12-7 12:28:29 | 显示全部楼层
谢邀。各平台杀熟为大数据经典应用之一。
发表于 2021-12-7 12:29:18 | 显示全部楼层
客户全生命周期营销里很多应用,中高端用户维系挽留,新用户质量分析,营业厅选址,产品推荐等。
发表于 2021-12-7 12:29:24 | 显示全部楼层
在选举中在中大量使用数据的做法起源于美国第44任总统奥巴马,2008年他第一次代表民主党参选期间,建立了专门的个人竞选网站,收集了1300万人的个人信息和邮箱地址,在此期间大规模的营销和宣传活动一般使用信息群发的方式,但奥巴马放弃了这种方式。他雇用了一批数据科学家,尝试通过对数据,对选民进行分类,向不同类别的选民推送不一样的定制信息,到2012年,奥巴马竞选连任这时候Facebook已经聚集了8亿用户,奥巴马的个人竞选网站实现了和facebook的联动。支持者一登录就被要求提交自己的facebook帐号网站会寻求是否可以读取其facebook上的档案信息,甚至所要在其社交页面上发布信息的授权,这两届总统选举都以民主党大获全胜告终。
奥巴马使用的大数据分析方法也成为教科书级别的经典案例,对民主党因为技术进步而获得的强大动员能力,当时的共和党竞选人无不羡慕,我称之为概括:政治技术决定政治成败
在此之后共和党痛定思痛,决心迎头赶上共和党,个别共和党大佬开始和技术极客交朋友,出资参与他们成立的数据公司,其中有一家,就是Facebook风波的主角剑桥分析公司,他在共和党大佬班农和共和党金主默瑟的支持下于2014年成立,这家公司之所以叫剑桥分析和他的团队和数据来源有关,剑桥大学心理学有一名年轻的研究员,柯根,2015年,科根以学术研究的名义在facebook上推出了一个小小的程序:这就是你的数字化生活,他宣称可以免费提供性格测试参与者还可以得到一个5美元左右的现金红包,这也是今天一个奇怪的现象一毛钱掉在地上很多人弯腰懒得去捡,但在互联网上的一毛钱,大众趋之若鹜,抢的不亦乐乎,最终32万人参与了科恩的调查。

是时候揭开互联网免费的外衣了,几乎所有的互联网服务都是免费的,但其使用者其实付出了代价--我们交出了数据,这也正是科根的用意,他不仅收集性格测试数据,还在它的过程中隐藏了一个数据爬虫,一旦用户使用这个程序就会,把通过这些用户帐号可以看到的信息和资料,诸如所在城市,点赞,好友等扒下来保存在自己的服务器上。
32万人如何变成8700万人呢?这个数字被放到了200多倍,这是因为facebook精心设置的缺省隐私政策,如果用户没有特别表示他的个人信息就会对他所有的朋友开放,放到科根爬虫的工作场景中,这意味着除非一个人的朋友已经特别声明自己不愿意分享信息,否则科根的爬虫在爬去某个人的信息,也同时可以把他朋友的信息一并爬去,于是,虽然参与科研测试的用户只有区区32万,但凭借缺省许可,这些种子最终开枝散叶,科根裂变式的收集到了8700万用户的信息。其代价仅仅为160万美元。
facebook对客人的爬虫咨询吗?
完全知情。科根在短短几周之内要从Facebook服务器上爬下8700万用户的数据,这些下载数据的行为会加重Facebook服务器的负担,触发安全警报。一般情况下Facebook不允许开发人员这样采集数据,但客人随后以学术研究为由应对了Facebook的问询,在facebook的平台上学术,研究恰恰是能被允许的。
可科根之后转手,8700万人的数据在云端悄无声息的回归到了剑桥分析公司的名下,科根的行为违反了他的承诺,所谓的学术研究很可能一开始就是幌子,但问题是,即使facebook也无法再追踪后续数据的交易如果不是风波发酵,除了交易的双方,又有谁能知道数据被买卖了多少次呢。我们无法监控数据的交易这也是今天这个时代难以解决的一个突出的问题。
facebook之所以大意,还有一个重要的原因,这些数据并不敏感,他们既不是用户的帐号也不是密码,只不过是用户名用户所在地,用户发贴以及一些貌似无关紧要的点赞数据,这些信息在facebook上是公开的几乎所有人都可以看得见。
出乎意料的是剑桥公司用这些看似不起眼的公开数据玩出了大花样,这家公司的办法不是从传统的人口学维度给选民分析证明,而是立足心理学给选民分类。这种全身的办法是在奥巴马的两次大选之后产生的。
大数据和心理学相结合竟然能爆发如此大的威力研究荣人员通过数据实验发现,通过社交网站的数据可以判断一个人的心理特质,其判断结果甚至比调查反弹这个人的亲朋好友还要准确,也就是说只要有足够的社交数据不用任何人为的介入,计算机和算法就可以自动判断一个人的心里素质,甚至仅仅凭借点赞数据就可以完成。因为没有无缘无故的爱每一个点赞背后都原因。
剑桥公司在这条路上走得更远他们把8700万人的社交数据在和美国商业市场上,二点二亿人的消费数据进行匹配组合和串联,找出谁是谁,然后就性别,年龄,兴趣爱好,性格特点,职业专长,政治立场观点倾向等上百个维度,给选民一一打算标签进行心理画像,建立心理档案。在通过这些心理档案开展分析总结出不同人群的希望点恐惧点,共鸣点,兴奋点,煽情点,以及心魔所在。
当代大数据读心术就此诞生了,掌握了一个人的心魔就可以评估一个人最容易受到哪种信息的影响,就可以知道信息该如何包装,如何推送,潜移默化的影响一个人的选择和判断。
发表于 2021-12-7 12:29:32 | 显示全部楼层
客户画像,智能推荐,预警检测,决策分析,自动驾驶,风险评估,语音识别,图像识别,个人助理等等
发表于 2021-12-7 12:29:41 | 显示全部楼层
大数据应用的案例现在很多了,智慧交通,智慧农业,智慧环保,智慧城市等很多领域。详细了解过一个中交二公局的隧道监测的案例,从中学到了很多知识。了解到具体项目中数据采集方式,数据类型处理和计算,数据整理备份,历史数据分析等多重方向综合论证监测效果,已达到监测预防处理等多重目标。同时针对检测结果数据分析可以延伸很多高利用价值的发散服务。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

QQ|Archiver|手机版|小黑屋|广告网 ( 鄂ICP备20005464号-17 )

GMT+8, 2024-5-9 23:24

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表