传统行业应用AI面临三大挑战高质量的数据是应用前提

2021-10-18 11:10
科技日报

要实现AI技术的应用，首先数据要达到一定的量，而且计算能力要能够支持大规模的模型训练。那么，算法要达到一定的精度，端侧计算能力也要有一定的推理能力。

目前只有消费互联网公司在大规模应用AI算法技术，主要是因为消费互联网公司在这三个方面更有优势。

3354朱鹏飞天津大学智能与计算系副教授。

近日，人工智能知名学者吴恩达发表文章，解释了他对人工智能在传统行业应用缓慢的理解。无论是刷短视频时的个性化推荐、取货时的耗时估算，还是移动支付时的人脸识别，以算法为代表的AI技术在消费互联网行业都得到了“得心应手”的应用。但说到传统行业，人们很难快速想到应用人工智能的典型成熟案例。为什么传统行业AI技术的应用速度和应用范围远不如消费互联网等行业？

消费互联网行业应用AI更具优势

"人工智能技术的应用主要依赖于数据、计算能力和算法."天津大学智能与计算系副教授朱鹏飞说：首先数据要达到一定量，这是应用的基础。此外，计算能力应该能够支持大规模的模型训练。那么，算法要达到一定的精度，端侧计算能力也要有一定的推理能力。

目前只有消费互联网公司在大规模应用AI技术，主要是因为消费互联网公司在这三个方面更有优势。

几年前，短视频还没有现在这么受欢迎。比如淘宝在发展初期并没有很强的用户粘性。随着推送越来越精准，用户体验得到了极大提升，最终出现了用户井喷式增长。

“精准推送主要靠算法精度的提升，算法精度的提升离不开海量数据。”朱鹏飞解释说，在这个单一场景中，算法模型需要不断进化和终身学习。由于不是封闭的数据环境，总是会有新的数据加入，因此算法模型需要通过学习进行调整和迭代升级，使其精度越来越高，形成良性循环。

“同时，虽然消费互联网行业的算法准确率已经上升到了一定的高度，但与一些传统行业的应用场景相比，消费互联网行业对于AI算法准确率的接受门槛相对较低。比如短视频、淘宝偏好推荐、百度热搜关键词只需要达到粘用户的目的，用户只要有一定的准确性就可以接受。”朱鹏飞说，相比之下，在很多传统行业，对技术精度的要求要高得多。比如基于视觉的AI技术在人脸识别中的应用，只有在高铁站、机场1: 1比对准确率高达99.99%甚至更高时才能应用。

在计算能力方面，云计算能力已经可以支持大规模的模型训练和推理，比如短视频和淘宝推荐。然而，在大量的传统工业应用场景中，智能终端的端侧计算能力无法满足推理的实时性和准确性要求。

“与社交网络、电商系统相比，传统行业应用场景的封闭生态系统，使得云计算力量无法得到有效应用。”朱鹏飞说，比如以智能无人系统巡逻为例，电力巡逻、管道巡逻、交通巡逻、河道巡逻、光伏巡逻等都需要无人机和机器人搭载的计算能力来满足实时巡逻的要求。由于视频分析模型的高度复杂性，端侧往往无法实现准确高效的实时推理，轻量级网络在满足实时性要求的同时失去识别精度。由于算法的精度达不到要求，本文提出了一种新的算法

“在传统制造企业从制造向智能制造转型的过程中，数据是一个非常突出的问题。”朱鹏飞介绍，首先，获取数据存在一些困难。传统制造企业的数据是封闭的，因为很多传统企业不是新的信息设备，没有传感器采集实时数据，也没有数据中心。因此数据分散、缺失严重，很难像消费互联网企业那样获得海量、高质量的数据。

其次，行业内各工厂的大量数据具有商业价值，因此工厂被严格保密，导致数据不流通，无法共享，从而形成数据孤岛效应，影响AI算法模型的优化。

“我们在开发AI算法模型时，由于数据的保密性，我们得到的数据往往会脱敏，严重影响我们的判断。但传统行业企业缺乏具备AI算法模型开发能力的技术人员，因此在合作研发过程中也存在较高的壁垒。”朱鹏飞说。

此外，传统行业的数据源并不像消费互联网领域那样来自单一场景。复杂的业务场景往往会导致“脏”数据，必须对其进行“清洗”，去除大量无效信息，使AI算法模型能够高效学习，提高其准确率。“就像我们教孩子知识，只讲知识点，让孩子学得快。如果知识点里夹杂了很多无用的信息，孩子分不清，学习效率肯定会下降。”朱鹏飞认为，为数据标注“知识点”的工作庞大而繁琐，需要企业有专门的人员来做，耗费大量的时间和精力。

“传统制造业要想获得高质量的数据，就必须对生产设备进行信息化、智能化改造。”朱鹏飞表示，这种转型需要企业投入大量的时间和精力，同时也会增加生产成本，这也成为AI在传统制造业应用的障碍。

传统行业应用AI面临三大挑战

近10年来，AI的研发和应用大多以“软件为中心”为驱动。在海量数据的支持下，不断优化软件和算法，以获得更高的算法精度。在传统行业。

无法提高数据质量和数量的情况下，吴恩达认为，传统行业应该采用“以数据为中心”的模式，把重点放在获得质量更好、匹配度更高的数据上。

“在这种思路下，传统行业也涌现了一些不错的应用案例。比如医学领域的影像识别AI系统，可以帮医生‘看’CT影像片子，对肿瘤等病变加以识别，辅助医生做出判断。”朱鹏飞介绍，由于很多数据都由专业的放射科医生在影像片子上进行了标注，因此数据比较准确，AI算法模型在学习的过程中进步很快。目前很多影像识别系统的准确率都能达到90%以上，由于是辅助医生，最后还需医生做医疗决策，但这个水平的准确率在很大程度上降低了医生的工作强度。

“尽管传统行业有了一些应用AI技术的成功案例，但是要想更好地和AI结合，还得在提高数据质量方面下功夫。”朱鹏飞建议，首先对于已经积累了海量数据的传统行业，在保证数据安全的前提下，主动开放数据。挖掘数据中蕴藏的价值，和需求关联起来，会有很大的发展空间。其次，对于新兴行业，比如新能源汽车等，在构建智能工厂规划的时候，就把获取数据、智能化的因素考虑进去。

不过朱鹏飞强调，在传统行业用好AI技术的同时，也不要滥用AI技术，在应用前做好评估，如果不能提高生产效率，对行业整体有所提升，那么盲目强行使用AI技术，就是对资源的浪费。“比如一些应用场景需要AI算法达到99%以上的精度才可以使用，通过评估，现有模型算法只能达到90%的精度，那么这个场景就没必要强行上马AI技术了。”

“总而言之，对于AI技术的应用要数据先行，有高质量的数据再谈应用，没有好的数据很难有好的应用。”朱鹏飞说。

扩展阅读