认识达内从这里开始

认真做教育专心促就业

百度人工智能技术进展与应用

发布：达内-鲍玉菲
来源：达内新闻
时间：2018-02-22 11:47

概述：

百度在人工智能方面布局已久，关键技术的进展十分迅猛，目前在语音识别、图像识别、自然语言处理、无人驾驶、机器学习、深度学习等人工智能相关领域共公开了1500余件发明专利，遥遥领先于微软、IBM等公司。其中，深度语音识别系统于2月入选《麻省理工科技评论》2016十大突破技术，百度也被选入全球50大创新公司。

百度大脑

组成百度大脑的三大部分：超大规模神经网络、计算、数据。

百度超大规模神经网络是模拟人脑神经元组成的网络，但却比人脑的神经元数量多一个量级，支持万亿级参数、千亿样本、千亿特征训练。

“百度大脑”的计算基于数十万台服务器，以及国内最大的GPU集群。

百度拥有海量数据，包括全网万亿网页、数十亿级搜索数据、百万级图像视频数据、百万级定位数据。

“百度大脑”主要包含语音、图像、自然语言处理、用户画像四大能力。

目前，百度的语音及图像能力相对成熟；自然语言处理仍处于早期阶段，因为除了认知能力外还要求具备推理、规划等能力；用户画像可根据用户的数据进行处理，描绘出每个人专属的特征。

语音能力

语音识别技术：百度深度语音识别技术Deep Speech2入选《麻省理工科技评论》“2016年十大突破技术”。目前，百度语音识别准确率为97%

语音合成技术：百度语音合成技术已应用到百度各个产品中，每天响应的语音合成请求量达到2.5亿次，以手机百度小说频道为例，听小说的用户从过去听40分钟，增长到现在的近两个半小时，并利用该技术复原张国荣的声音。“百度大脑”的语音合成能力只需要按照要求说50句话，便可以让每个人拥有自己的声音模型。

图像能力

人脸识别：百度人脸识别准确率达到99.7%，该技术可识别人脸上的72个特征点，并将这些特征点连结起来形成面部表情网，可据此识别每个人的各种表情。

OCR识别：采集全景图片，利用OCR技术，自动进行目标识别，实现百度地图中的POI、导航等信息的快速更新。

无人车视觉：无人车中也运用到了图像识别技术，在专为自动驾驶设定的KITTI测试中，百度在车辆检测方面排名第一

AR：AR依赖于图像识别技术，通过识别、理解现实场景，将虚拟与现实世界融合，用户可进行交互。我可以把现实世界中我的产品和虚拟世界中我希望用户感知的东西结合在一起，这是一种新型的广告形式，和用户进行互动，这里面不仅有图像识别的技术，也很大程度上取决于广告主的创意，如果创意和这个技术结合，对消费者的吸引力也非常大，带来实惠。百度AR团队研究的核心技术包括：图像识别与追踪、视觉同时定位与建图（SLAM）技术、AR渲染引擎、以及传感器数据融合技术。其中，图像识别与追踪技术在iOS和Android平台上的运行时间和识别精度都处于世界领先地位。应用方面，在最常使用的app中，手机百度是第一个集成AR功能的APP, 这意味着数亿用户已经可以体验AR功能。

自然语言处理能力

度秘：目前，用户和度秘的交互大约有56%是通过语音和图像来完成的，就像和人对话一样，这种方式非常自然，更顺应人性。度秘可利用自然语言处理能力解说奥运篮球比赛，通过提前学习几百场NBA和以往奥运会篮球比赛的解说和评论，不断理解比赛，将枯燥的数据转化为解说员风格的语言。度秘除了它能够识别语音和图像之外，其实它更关键、更核心的技术，是能够用人的语言来与人进行交流，并且能够理解人的很多意思和意图，尽管不是每一次都能理解。

百度翻译：百度翻译支持27种语言互译，通过自然语言处理能力，理解用户想要说什么，实现无障碍沟通。

用户画像能力

百度系产品拥有10亿日活量，基于大数据、机器学习等技术，将这些数据划分为千万级的细分标签。目前，百度的用户画像分为两个维度，垂直画像支持金融、保险、生活服务、零售、旅游、房产、咨询等深度行业应用，通用画像则基于人口属性、位置属性、长期兴趣、短期意图、APP偏好等描绘用户画像，支持全行业个性化应用。

手机百度：利用用户画像能力，手机百度资讯推荐阅读量在两个月内增长10倍，手机百度在新闻垂类里，拥有61.5万个细分标签。

行业合作：2016年6月份上映的电影《魔兽》，它的出品人是传奇影业，他们就是利用了百度大脑的用户画像功能来提升了200%的票房。做法是将人群分成三类，一类人是不管怎么样都要看的，另外一类是不管怎么样都不会看的，这两种人他们都不太关心。它关心的是它可以影响的人群，再通过用户画像把这些人从摇摆的转换成真正去电影院看的。

< 上一篇：百度人工智能硬件基础与算法的深度学习

下一篇：人工智能-无人车核心技术 >