迪丽热巴 dl

主讲导师 | 赵鹏昊 本文编辑 | 师侥
去年3月,智东西公开课推出超级公开课NVIDIA专场,目前已讲解完12场,共12位主讲导师参与 。
本次讲解为超级公开课NVIDIA&百度联合专场,也是超级公开课NVIDIA专场第11讲,由百度AI技术生态部高级算法工程师赵鹏昊主讲,主题为《如何借助GPU集群搭建AI训练和推理平台——零算法基础的百度EasyDL定制化图像识别揭秘》 。
赵鹏昊老师对百度EasyDL定制化训练和服务平台进行了全面讲解 。EasyDL是基于大规模NVIDIA Tesla P4,P40为主的GPU集群搭建而成,使得算法小白也能通过这一平台最快五分钟完成一些小规模数据集的训练,获得一个90%以上的高精度的定制化模型 。目前EasyDL主要开放了图像分类、物体检测和声音分类能力 。
以下是赵鹏昊老师的主讲实录与大纲,共计9418字,预计10分钟读完 。
大纲
1.AI赋能行业的痛点
2.EasyDL服务端和设备端技术解析
3.GPU集群加速EasyDL训练与推理
4.EasyDL赋能行业案例分享
主讲实录
赵鹏昊:大家好,我是百度的工程师,赵鹏昊 。今天晚上给大家讲解我们是如何利用GPU集群搭建的一些EasyDL平台的 。我们今天会从以下四点给大家进行讲解 。第一点是:AI赋能行业的痛点;第二点:我们EasyDL平台的服务端和设备端的技术解析,第三点:我们如何利用GPU集群来加速EasyDL的训练和推理 。最后是我们EasyDL对行业的一些案例的分享 。
AI已经是大家耳熟能详的名词了,像我们生活中都能见到像人脸识别的技术、像我们百度出的小度在家、小度智能音箱这种智能语音的技术、多轮对话的技术还有我们百度与金龙客车合作的无人驾驶技术 。这些都已经慢慢的进入到我们寻常人家并在改变我们的生活 。近十几年来,我们在理论上、框架上、芯片上等等各个方面上技术的发展,AI正在成为新时代的电力 。

迪丽热巴 dl

文章插图
为了让AI成为新时代的电力,百度AI开放平台开放了一些通用的模型来解决一些通用的需求,比方说,我们已经开放了OCR技术、图像识别、自然语言处理等技术 。百度AI开放平台使用通用的模型去解决一些同样的问题,比如OCR技术里面会有一些身份证、银行卡的OCR识别 。这些技术运用了我们百度内部长期积累的数据和算法,我们希望通过我们积累的这些数据和算法,能够提供高质量的模型来给用户使用 。
有些客户会有一些像右边这些图中的需求:比方说:他们想要通过图片去识别出这是哪种中草药,以此来帮助他们的工作人员去进行药品鉴定 。再比如说:品牌的零售广告主,他们会签约一些小超市和小卖部,让他们把自己的产品摆放在货架大部分的位置,所以就有了巡检员去巡检摆放合不合规 。
迪丽热巴 dl

文章插图
但是通用模型解决不了这些需求,这就涉及到AI定制化需求时碰到一些难题,这些客户的核心诉求,第一:通用的API不能够满足他们的业务需求,需要根据他们自己的数据去训练他们独特的模型 。第二:这些客户往往对自己的专业的领域知识很了解,但是他们不了解深度学习的理论和模型训练的方法,而且他们也不希望去面对繁琐的训练、部署、运维等工作 。第三:他们希望快速的去验证这个模型的效果 。
用户在验证效果满意之后,还希望能够拿到一个定制化服务的API或者想要做自由化的部署,拿到一个离线的SDK,去结合他们的产品做成一整套自己的产品和服务 。
迪丽热巴 dl

文章插图
EasyDL平台正是看到了AI赋能行业的痛点,看到了用户在做定制化需求时的诉求,所以开发了这样一个定制化训练模型和服务的平台,左图是EasyDL平台的整体架构,用户提供自己的数据,这些数据可能是图片、文本、声音或者视频等等 。然后放入平台中,由平台做加工学习、部署和服务 。最终给用户提供一个云端独立的RestAPI或者是一个离线SDK,让用户能够补充到自己的终端智能设备中 。
我们跟普通机器学习和深度学习工具的差异,跟TensorFlow或跟百度自己的PaddlePaddle这些工具的差异是:提供从数据到服务的一站式平台,不需要用户有任何机器学习或深度学习基础,并且我们按能力划分:比如图像分类能力、物体检测能力、声音分类能力以及刚上线的声音分类能力后面还会有更多能力 。我们不仅提供了一个云端的RestAPI的服务,还提供了设备端SDK的服务 。

秒懂生活扩展阅读