文本标注:
文本标注主要是为自然语言处理(NLP)的相关应用提供数据,包括文本分类、情绪标注、知识点标注等,也可以是一些专门领域的应用标注,比如家谱的谱系关系标注。对知识点的标注可以进一步建立知识图谱,并在此基础提供更深层丰富的知识服务。下图是一个基础教育领域的知识点标注项目界面:
下图是家谱谱系人物关系标注后的可视化展示图:
音像/视频标注:
图像和视频的标注随着近几年计算机视觉的强劲势头占据了整个数据标注业务的主流。需要大量标注好的数据对深度神经网络进行训练,它才能正确地理解场景。不论是人脸识别、路况感知、智能安防、无人超市、无人驾驶等应用场景,由于视觉信息的多样性和复杂性,没有大量的数据训练作为基础,要正确地识别、理解几乎是不可能的。
下图为所作人物行为标注项目的截图,每个人物包含了面部关键特征、姿态、方位和动作等数十个属性:
下图是交通路况标注截图,包含了车辆的型号、颜色、角度、车牌、角度等信息,以及天气、行人等相关信息:
音频标注:
语音数据标注,包括文本、噪音、情绪、意图等属性。为了精准标注,语音信号被切分成小片段,并且通过双人独立标注加上比对和质检以保证标注质量。
下图为标注时的音频片段截取界面:
数据标注平台:
数据标注是众多人工智能应用得以实现的重要基础,因为标注好的数据正是这些人工智能系统的知识,有了知识人工智能才有力量。数据标注实际上是一个将人类(数据标注人员)的经验和知识注入机器智能的过程,好的数据标注质量对人工智能应用的成败至关重要。
点通公司基于自己多年的数据服务经验,开发了专业的人工智能数据标注平台,它集流程配置、数据分派、标注软件、质量控制、进度监控、费用结算于一体:
该平台还集成了多种信息管理功能,如员工档案管理、员工技能培训管理等;并提供了在线交流平台,标注员可以在平台上实时沟通,方便员工之间的信息交流和有效沟通。依托于该数据标注平台,可将分布在全国各个数据加工中心的标注人员汇聚到一起,实现人力资源、计算资源和网络资源的最优配置。
对于客户而言,借助数据标注平台可以在数据质量、项目进度和成本费用方面获得全方位的控制。平台可开放监控接口给客户,实时掌握数据标注进度。
合作方式
数据标注的合作分以下三个简明步骤: