百度最近有三件事:发布财报,员工涨薪,开放大数据引擎。
财报营收、净利润涨势喜人;员工涨薪更有动力;百度的核心业务依旧是搜索,去哪儿爱奇艺的投资、移动互联网、O2O等服务的点缀。表面看都只是量的叠加。但当Robin为百度技术开放日首度站台的时候,我们恍然发现,百度,甚至整个互联网已经从量变走向质变了。而质变意味着可能再造一个百度。
质变到来
正如Robin所说,很多年他在美国学人工智能的时候,发现没什么实际的用处,都是些理论的东西,真正拿到实际的应用当中,可以运用的东西非常少。
一直到前几年很多人还是有这样的观念,但是最近几年就完全不一样了。技术积累到一定地步的时候,会发生从量变到质变。量变过程中不会觉得它有多么significant,但当发生质变的时候就有可能被打得措手不及。
我们的意识里,都是互联网改变了生活,却感受不到技术对互联网的改变。
中国互联网发展了20年,到现在我们才清楚地看到,互联网已经逐渐颠覆了媒体、零售、旅游、金融,传统行业这时候着急了。这都是拜技术所赐。如摩尔定律,每隔18个月计算机的计算能力会增加一倍,成本会降到一半。表面是一种量变,计算机计算能力越来越快、存储成本越来越低。但连续几十年发生之后,人工智能真的有用了、计算机也真的可以像人一样开始思考了。
未来世界的本质是数据流
中国互联网发展了20年,从门户、BBS、搜索、博客、SNS、电子商务、视频、微博、微信,再到自媒体、互联网金融、众筹等等,完成了基础设施和互联网应用的建设和普及。也可以说完成了信息流、物流、人流、资金流流动渠道的构建。
下一个20年等待我们的是什么?露出苗头的可穿戴设备告诉我们,上面的四个流都将汇聚成数据流,我们将迎来大数据时代。以媒体为例,都是在卖影响力,然而技术的变革,导致渠道的变化,渠道的变化导致客户以及受众的注意力转移。所以,《竞报》、《天天新报》等纸媒倒下了;网络媒体也面临着移动互联网的冲击,一直在卖影响力,很容易达到极限。一旦下一代技术带来质变,读者走了、客户跑了,可以想想门户和新闻客户端的关系。媒体形态的改变、内容的生产方向,都将建立在数据基础之上,被数据引导。
为什么是百度?
百度的大数据引擎由开放云、数据工厂和百度大脑三大组件组成,对大数据进行收集、存储、计算、挖掘和管理,并通过深度学习技术和数据建模技术,使数据具有“智能”。
大数据引擎由开放云、数据工厂和百度大脑三大组件组成,对大数据进行收集、存储、计算、挖掘和管理,并通过深度学习技术和数据建模技术,使数据具有“智能”。“百度开放云”是大数据引擎运行的基础构件,通过分布各地的百度新一代高效能数据中心为传统行业提供超大规模的数据存储和分布式计算。在此基础上,“数据工厂”对行业数据进行一系列规范化处理,提供强大的数据管理和分析能力。
更上一层,则是百度人工智能的精华——“百度大脑(Baidu Brain)”,基于百度深度学习研究院的成果,融合深度学习算法、数据建模、大规模GPU并行化平台等技术,实现了无不不刻都在学习与成长,它拥有200亿个参数,构造起深度神经网络。以此实现智能数据分析及预测功能,实现数据智能,支持科学决策与创造。
而与其它有大数据能力的企业相比,阿里的大数据是基于淘宝等平台摸清消费者习惯,应用体现在数据魔方、聚石塔,同时也让外部数据接到阿里云上来,这与百度模式相似。但阿里在语音、图像等识别上技术欠缺,在人工智能上缺乏想象空间;腾讯与阿里类似,未能提供智能化的解决方案。
Google与百度思路一样,提供的大数据分析智能应用包括客户情绪分析、交易风险(欺诈分析)、产品推荐、消息路由、诊断、客户流失预测、法律文案分类、电子邮件内容过滤、政治倾向预测、物种鉴定等多个方面,但还未考虑将大数据独立共享。
能否再造一个百度?
越来越多机构、企业都迫切希望从大数据中挖掘出有价值的趋势洞察,但都普遍面临着大数据应用困境。数据孤岛严重、数据存储与管理、数据分析挖掘以及智能化能力也都存在着难以突破的瓶颈。
百度的开放大数据引擎,将是与搜索引擎并列、甚至比搜索引擎更具想象空间的平台,构建一个全新生态。解决传统产业问题:管理、产品迭代、新商业模式等。百度已经有了传统企业客户基础,在大数据引擎上收入也更加多元化,如CTR、服务升级、新模式(如金融知心)等。传统行业市场空间巨大,大量行业的单行业产值都在万亿级以上。百度大数据核心能力的开放将成为行业转型和模式创新的引擎,撬动万亿级产业升级的想象空间。
大数据未来应用场景
城市旅游预测
哪些城市将被挤爆,哪里的人最爱去哪里,反映各旅游景点未来的人流趋势。
Babycry
刚出生的宝宝的哭声,家长不知道如何处理,父母可以将婴儿的哭声录下来,在百度语音库中对比,是饿了,还是哪里不舒服了,更直观清晰的了解孩子为什么哭。
安保追逃
摄像头信息记录及分析,可以通过海量监控视频中通过图像识别技术找出犯罪嫌疑人,解决社会问题。