行业发展趋势 - 数据服务行业将向更加智能化发展,通过拓展算法覆盖场景和提升算法准确率,持续提升机器参与程度和人机协作效率,降低数据处理成本[3] - 数据安全和合规能力将成为数据服务能力的核心评价维度,成熟的安全合规管理体系将成为重要评价标准[3][4] - 多语种能力将成为支撑企业顺利出海的核心要素之一,具有强大语言研究能力的数据服务企业将获得更多商业机会[3] - 充足、稳定且高质量的数据处理团队储备以及更加智能化的资源配置能力,将成为数据高效、稳定交付的重要保障[4] 公司竞争优势 - 公司拥有丰富的产品积累、成熟的数据处理技术和平台、全球化的供应链管理能力等竞争优势[4][5] - 公司深入重视数据安全和合规,在日益完善的法律环境下,这方面的投入为公司带来了新的竞争壁垒,也将会为公司未来在垂直行业和政企业务拓展形成有利优势[4][5] - 公司持续大规模投入研发和人才建设,为应对基于自身技术属性的同业公司的未来竞争提前布局[5] 训练数据生产流程 - 训练数据生产主要包括设计、采集、加工和质检4个环节[5][6][7][8][9] - 设计环节通过确定训练数据集的结构和属性,为后续采集工作奠定基础[6] - 采集环节根据数据量和属性要求获取原料数据[7][8] - 加工环节通过公司平台对原料数据进行标注,提高标注效率和准确度[8][9] - 质检环节渗透在全流程,确保各环节数据质量[9] 客户需求分析 - 客户对训练数据的需求是持续的,随着AI技术应用场景越来越多,各种场景的数据集需求会不断增加[9][10] - 智能驾驶数据业务的市场需求主要取决于车型及传感器丰富度、量产车数量以及智能驾驶级别的提升,这三个因素的共同作用将带来指数级的数据处理需求增长[10][11] 新兴业务发展 - 公司将持续探索围绕大模型所需数据相关服务,开展以预训练、强化学习为代表的多元化数据获取、高阶垂向拓展等方向的数据服务能力建设[13][14] - 公司还将探索以数据治理、数据交易、数据处理等为核心的数据要素领域,力争将数据要素创新业务打造成为具有潜在高增长价值的新兴业务板块[14]