海天瑞声(688787) - 投资者关系活动记录表-(2024年10月25日)
海天瑞声(688787)2024-10-25 18:25
训练数据生产流程 - 训练数据生产包括设计、采集、加工和质检4个环节 [1][2][3][4][5][6] - 设计环节确定训练数据集结构和数据属性要求 [2][3] - 采集环节根据设计要求获取原料数据,需考虑数据量和数据属性 [3][4][5] - 加工环节通过标注工具对原料数据进行标注处理 [5] - 质检环节贯穿全流程,对各环节数据质量进行检测 [5][6] 定价和收费模式 - 定制服务采用成本加成定价法,根据具体需求预估成本并加成 [6][7] - 产品定价采用需求导向定价法,综合考虑成本、市场需求等因素 [7] 语言学研究价值 - 语音语言学知识是构建高质量语音算法的关键 [7][8][9] - 公司在发音词典、语言模型等方面有深厚积累,覆盖200多种语种 [9] 训练数据解决方案难点 - 设计和采集环节需要应对复杂场景和技术要求 [9][10] - 标注环节需要提高效率的同时保证数据质量 [10] 大模型数据需求 - 大模型数据来源包括个人、企业、公共和版权数据 [11][12][13][14] - 大模型数据需求在规模、质量和来源上有别于传统模型 [13][14] 智能驾驶数据业务 - 智能驾驶数据需求受车型、量产车数量和智能驾驶级别影响 [14][15] - 未来智能驾驶数据需求将呈指数级增长 [15] 智能驾驶数据核心竞争力 - 平台能力、算法能力和数据安全能力是核心竞争力 [15][16]