而文字、图片等领域里,这种事很好办,互联网上一大堆各种各样的数据。
但是在专业领域里,这些数据就很难获得了……这也是智云机器人团队,弄了N多数据工厂的缘故,这些数据工厂,主要的任务就是‘生产用于人工智能学习的数据’,同时对人工智能的学习过程进行纠正。
很少有人知道,智云集团旗下的机器人业务团队,在全国范围里已经和多家企业进行合作,目前有十多个数据工厂,超过五万名数据员工正在持续为智云机器人提供各种各样的训练数据内容,并对训练过程进行纠正。
光是这一部分的数据采集、纠正成本都是一个非常庞大的数字。
但是没办法,人工智能就算再聪明,学习效率再高,它也得有学习的样本才行啊。
所以,机器人的研发团队,只能搞这么原始的数据工厂。
这些单纯模仿人们工作的训练数据,其实都还算容易获得,而其他一些特殊领域的数据获得更难,成本更高。
比如AI战斗机的训练数据!
为了获得足够多的训练数据,X项目团队可是和相关机构合作,给一大堆现飞机安装了数据收集设备,同时又弄了一大堆模拟驾驶飞机,给飞行员用于日常训练的同时,也是用来收集数据。
整个数据的收集过程非常的复杂,而且成本也非常高。
内容未完,下一页继续阅读