公司业务拓展 - 公司持续加大大模型数据方向的研发投入,已完成并持续建设多领域大模型数据集,包括大语言模型中文对话预训练数据集、语音大模型微调数据集、视觉大模型预训练及微调数据集等 [3] - 公司重点开发了医疗、金融、法律、艺术等垂直领域的标注资源,形成垂直领域专家库,为高质量行业数据服务奠定基础 [3] - 公司与清华大学联合启动多语种语音大模型研发计划,提升多语种语音数据处理的效率和准确性 [4] 海外业务发展 - 前三季度海外客户需求增速明显,尤其是在大模型驱动的背景下,境外头部客户对AI的投入力度加大 [5] - 公司持续加强境外销售团队建设,通过参与全球知名行业及学术顶会,以及布局搜索广告投放、社交媒体矩阵等多类宣传渠道,提升行业影响力和美誉度 [6] - 2024年公司全新发布海外官网,通过搭建marketplace,有效提升新客户拓展以及订单转化率 [6] 数据需求与市场竞争 - 公司观察到在IoT硬件厂商的端侧应用中,数据需求呈现共性特点,包括语音转写、文档修饰、改写、生成摘要、短信自动回复、图片和视频自动处理等 [7] - 公司认为语音交互会成为未来AI一种很重要的交互方式,尤其是跨国公司在推广其AI硬件产品时,对多语言数据的需求呈现增长态势 [7] - 公司预判整个数据服务市场将进行重新洗牌,集中度将进一步提升,技术研发投入、资源能力建设等主要方面的竞争将逐步淘汰研发能力弱、资源势力差的品牌服务商和中小玩家 [11] 技术研发与业绩增长 - 公司前三季度的收入增速为44.90%,相较去年同期实现显著增长,说明公司在数据领域的研发投入开始逐步显现 [12] - 公司凭借多年来在语言研究以及计算机视觉和自然语言方面的技术积累、以及全球领先的标准化数据集储备,进一步赢得了境内外客户信赖 [12] - 公司进一步加大基础研发投入,提升人工智能基础算法、一体化数据处理平台和前沿技术研发等能力,持续提升标注效率,降低数据处理成本 [12]