AI数据场景化,推动智能家居场景化落地

未知 2020-10-20 13:38
AI数据场景化,推动智能家居场景化落地




清晨,你说“我要出门了”,智能音箱就开始为你播放天气预报、日程安排和路线路况等信息;

出门后,你想起家里的空调忘了关,于是点一下手机,把空调关掉;

下班后,你回到家里,家里的空调已经打开,热水器已经烧好热水,你可以在舒适的温度中泡个热水澡,洗去一天的疲惫;

深夜,你说“我睡不着”,智能音箱就为你播放各种白噪音,助你快速入眠……

这是几个典型的智能家居应用场景,虽然有些可能还未成真,但是我们有理由相信,在不久的将来,这些都会变成现实。

而这份信心,正是来源于近几年一直快速增长的智能家居市场趋势:

据IDC的研究报告显示,2018年中国智能家居市场累计出货1.56亿台,较2017年增长了36.7%;2019年中国智能家居市场出货量达2.08亿台,较2018年增长了33.5%;而2020年虽然受到新冠肺炎疫情的影响,我国智能家居出货量的增速有所放缓,但是预计仍会实现增长,出货量将达2.15亿台。

来自iiMedia Research的数据则显示,2019年中国智能家居的市场规模已达1530亿元,预计2020年中国智能家居的市场规模将突破1700亿元,达到1705亿元。



没有数据标注,就没有“智能化”

众所周知,除了受政策利好,以及居民消费结构变化的影响,智能家居的发展主要得益于AI、IOT、大数据等信息技术的推动,它们让智能家居的便捷性和无接触交互方式的优势得以实现和凸显,尤其是AI技术。

而让AI发挥出强大能力的前提是:必须有大量的AI数据作为训练支撑。需要强调的是,这些AI数据并不是“原始数据”,必须是经过“标注”的数据,这样才能应用于AI训练,成为AI学习的根基。

通过“数据标注”,可以将图像、语音、文本、视频等进行分类、注释、标记,转换为机器能理解、能看懂的AI数据内容,从而能够被机器学习识别、处理。

可以说,没有高质量的AI数据标注,就没有AI的未来,也就不会有智能家居产业蓬勃发展的今天。

10月16日,云测数据在2020中国(杭州)国际智能产品博览会暨全球人工智能大会上发布了智能家居领域首个AI训练数据解决方案,就是希望通过提供高质量且专业的AI数据服务,助力智能家居产业智能化升级。



依托于丰富的项目经验与对行业的深入理解,云测数据可以为智能家居企业提供从数据采集、数据标注、平台私有化部署,到标注驻场服务的全流程、一站式AI数据服务。


如今,智能家居已经走过了“自动化”、“单品智能化”、“物联网+家居场景”三个阶段,进入了 “AI+家居场景”的阶段。

伴随着应用落地,AI所需的训练数据要求复杂度逐渐提升,对数据质量、场景丰富度,以及行业知识的要求也在提高。

AI主要解决的是机器在看、听、理解方面的问题,以实现 “人机协作”,对场景数据的需求包括语音、图像、文本、视频等各个领域。所以,数据的精细化程度就决定了算法的“人性化”程度,反应到现实场景中,就决定了智能家居带给用户的体验是否够智能、够人性化。

而云测数据的AI训练数据解决方案覆盖了丰富的场景品类,储备了多品类样本,通过搭建智能家居真实场景,可实现AI数据场景化。同时,该方案还支持全类型的数据标注与定制化数据采集:在语音方面,支持ASR语音转写、声纹识别标注、说话人识别、语音切割、情绪判定标注等;在自然语言处理方面,支持OCR转写、NLU语句泛化、文本信息抽取、实体标注、词性标注、槽位填充等等。

为了产出更高质、高效的智能家居领域AI数据,云测数据在自建数据标注基地和数据场景实验室的基础上,还对技术软硬件设施进行持续投入,不断提升数据标注工具的技术含量。同时,云测数据还建立了一整套的标准化流程、方法论和人员机制,来保证数据服务团队的专业能力,以确保输出高质量、精细化的AI数据,为智能家居领域输出源源不断的“智慧”,让智能家居更加“智能化”,带给用户的体验也更加“人性化”。

数据标注精准度创新高,加速AI时代到来

与此同时,作为智能家居领域首个AI训练数据解决方案,其发布也见证AI数据标注行业发展迈上了新的台阶,逐渐走向成熟。

毋庸置疑的是,数据标注已成为AI的核心驱动力。但数据标注行业仍然存在着技术门槛低、从业人员水平良莠不齐等问题,难以保证数据标注的质量。如今,经过“野蛮生长”阶段,数据标注行业正逐渐步入相对正规的良性发展阶段。



今年9月,云测数据在首场国家级重大国际经贸活动服贸会上发布了一项数据标注领域的重要成果:云测数据项目最高交付精准度达到了99.99%。这是目前数据标注领域可达到的最高服务标准,处于绝对领先位置。这不仅为行业树立了新的标杆,也意味着数据标注行业从劳动密集型开始转变为技能密集型,数据标注的价值从“AI产品训练”发展到“AI产品落地”阶段。

而高精准度就意味着高质量的数据,这将大大提升AI的识别能力和执行能力,可以助力智能家居企业以更高的效率、更短的时间,甚至更低的成本,推出更智能的产品,不仅能提升企业自身的竞争力,也将加快智能家居的普及,加速推进人工智能时代的到来。尤其是在5G商用落地和新基建兴起的大环境下,为新旧动能转换、各产业“智能化”升级注入了向更高效、更高质量发展的信心。

引领AI数据服务行业发展,底气源自积淀

随着产业对AI训练数据需求的增加,对服务标准要求的提高,AI 产业链的专业化分工正愈加精细,我国 AI 基础数据服务行业也正日臻成熟,专业化的训练数据服务提供商在 AI 产业链上扮演着越来越重要的角色。云测数据就是最有代表性的AI训练数据服务提供商之一。

作为Testin云测旗下AI数据标注服务品牌,云测数据拥有自建的数据场景实验室和数据标注基地,在华东、华北、华南均设有数据交付中心和数据采集基地,可以为AI场景化落地提供高质量的数据支撑。除了智能家居行业,云测数据还可以为智能驾驶、智慧城市、智慧金融、新零售等众多领域提供数据采集、数据标注服务。目前,云测数据已经与数百家互联网企业、科技企业和向智能化转型的传统企业建立了良好持久的合作。

作为AI数据采集标注领域的头部企业,云测数据一直致力于推动AI数据服务的高质量、场景化、精细化和提升数据隐私安全性,引领行业规范发展。而其之所以能够引领AI数据服务行业的发展,离不开在AI数据领域长时间的积累和沉淀:

其一,云测数据拥有高质量数据的保证。为保证数据交付的质量,云测数据搭建了场景实验室和数据标注基地,进行相应的数据生产。在项目前期,云测数据项目经理会帮助客户梳理更贴合实际情况的需求,在试标验收合格后,再开始大规模作业。在数据标注作业提交后,还有三层质检环节和抽检环节,以确保高质量的数据输出。在数据交付的流程中,也会有项目经理全程跟踪。

其二,云测数据拥有高效的作业效率。为保证生产效率,云测数据十分强调作业协同化。在AI数据生产中,云测数据设计了从创建任务、分配任务、标注流转、到质检/抽检环节和最后验收等完善的管理流程,每个环节都有相应的专业人员来把控数据标注的质量和时间节点,进行上下游工作环节的衔接,在保证数据质量的前提下,可以真正提高作业效率。

其三,云测数据会对数据隐私安全进行把控。为确保数据隐私安全,云测数据设置了一系列严格措施:核心原则就是数据绝不复用,数据合格交付后从不留底;而且,云测数据会和所有数据采集用户签订数据授权协议,从来源上确保企业用于训练的数据合法合规;此外,云测数据还设定了数据隔离、质量保障等一系列数据安全流程和技术。

很显然,高质量的AI数据将成为企业的核心竞争壁垒。而对于AI数据服务企业来说,帮助客户企业建立数据核心壁垒,完成高质量的AI数据交付,是企业发展的重中之重,而这也是云测数据一直倡导和践行的标准。
标签