海天瑞声登陆科创板 聚焦训练数据集推动AI产业落地
2021-07-26   作者:CIS

投资要点:

1.AI训练数据领头羊,业绩增长快速,盈利能力强劲。公司长期专注于训练数据的研发生产,已成为国内AI基础数据行业领先者,尤其在语音类市场市占率排名第一。2017年至2020年,营业收入年均复合增长率超过25%,且销售毛利率保持在65%及以上。

2.技术实力强劲,紧握优质客户资源。公司拥有760多个自有知识产权的训练数据集产品,具备多场景、多语言覆盖能力,积累了丰富的多语种语言学家团队,并与下游的阿里巴巴、腾讯、百度、微软等客户形成了稳定合作关系。

3.人工智能市场持续增长,推动训练数据行业成长。“十四五”规划将人工智能提升至国家战略层面,随着政策落地、技术突破和产业融合,我国人工智能步入黄金发展期。同时,IDC预测未来几年我国AI产业规模年复合增长率可达到30%,将拉动上游训练数据需求不断增长。

近年来,人工智能的发展得到了巨大的进步,深刻改变着各行各业,渗透到人们的日常生活中。数据作为人工智能发展的重要元素,从本质上决定了人工智能的进化水平,优质、丰富的训练数据对人工智能技术的发展至关重要。

经过多年深耕,海天瑞声(688787.SH)已成为中国AI基础数据服务行业的头部企业。公司所提供的训练数据覆盖智能语音、计算机视觉、自然语言等多个核心领域,全面服务于人机交互、智能驾驶、智慧城市等多种创新应用场景。如今,海天瑞声科创板IPO已经通过证监会注册,即将挂牌上市。

AI持续高增长,海天瑞声领跑训练数据赛道

随着大数据、云计算、物联网等技术的发展,人工智能领域相关技术的产业化进程开启,产业规模快速增长。根据国际数据公司(IDC)的数据,2020年中国人工智能产业规模将达到62.70亿美元,预计2024年将达172.16亿美元,年复合增长率达到30.40%。

训练数据资源是机器学习的基本素材,应用场景的创新和机器学习算法的流行直接带动了训练数据需求的大幅增长。艾瑞咨询的研究报告显示,2019年中国基础数据服务行业的市场规模达到30.9亿元,预计2025年将突破100亿元,复合年增长率达到21.8%。

海天瑞声成立于2005年,始终致力于为AI产业链上的各类机构提供算法模型开发训练所需的专业数据集。2017年至2020年,海天瑞声的营业收入从1.19亿元增长至2.33亿元,年均复合增长率达25.15%。其中,训练数据定制服务和训练数据产品是主要收入来源,从2020年数据来看,二者占总营业收入的比例分别为50.26%、45.48%。不仅如此,这两类业务均表现出较强的盈利能力,带动公司总体盈利水平的提高。2020年公司综合毛利率水平为67.70%,净利率达到了35.17%。

凭借丰富的技术积累和行业经验,公司提供的训练数据产品及相关服务已覆盖三大技术领域、多个语种/方言和多项应用场景,赢得了阿里巴巴、腾讯、百度、微软、三星、亚马逊、科大讯飞、商汤科技、中国科学院、清华大学等众多大型优质客户的认可,核心技术、产品资源、优质客户等竞争优势逐步凸显。

公司在行业内占据领先地位,根据艾瑞咨询发布的《2020年中国AI基础数据服务行业研究报告》,2019年海天瑞声在国内基础数据服务行业以约8%的市场份额位列第二;同时,公司牢牢掌握着中国语音类基础数据服务这个细分市场,营收份额占比排名第一。

产品布局完善,研发创新打造核心竞争力

由于人工智能技术在场景中应用不断深化,单一技术实现的技术闭环难以满足复杂场景下的智能化需求,客户对于智能算法的能力要求也在持续升高。海天瑞声始终秉承基础研究与实际应用紧密结合的原则,持续开展基础研发等研究创新工作。

技术研发有赖于公司长期经验积累、人才储备。公司高管及核心人员大多毕业于清华、北大、中科大、复旦等一流院校,大部分曾在微软、阿里巴巴、英特尔、IBM、中科院等业内领先成熟企业与研究机构,并担任人工智能领域技术研发与管理的领导职务。高素质的技术团队形成公司强大的研发与服务优势。

近年来公司不断加大研发投入,2018年、2019年及2020年公司研发费用分别为2734.53万元、4169.61万元及4349.75万元,呈逐年上升趋势。这三年时间里,公司累计研发投入达到11253.89万元,累计研发投入占收入比重为16.96%。

公司的科技成果转化效益明显。截至目前,公司已取得26项专利授权(其中24项为发明专利,1项为实用新型专利、1项为外观设计专利)、拥有134项计算机软件著作权,另有2项专利已提交申请且已经受理,处于行业领先地位。

通过集中优势力量、定向攻关,海天瑞声建设完成了760多个自有知识产权的AI训练数据集,并向下游客户提供了累计超3600次/个训练数据定制服务或训练数据产品,产品和服务线可支持全球超过160个语种和方言,构建了全球领先的独具特色的人工智能训练数据资源集群。

值得一提的是,公司基于自身近十六年数据服务经验,并融合了数十项核心技术及专利,打造了一体化数据处理平台。平台内上千个自研标注工具联合打通,不仅可以用来处理复杂的交叉业务场景数据,更重要的是保证了数据从采集到脱敏、清洗、标注、质检等全流程不出平台即可完成,构建了流程化、规范化和体系化的训练数据生产体系。在平台支持下,训练数据生产成本大幅降低,产能和效率明显提高。

在持续努力下,海天瑞声的技术实力得到行业、主管机构的高度认可。公司荣膺多项资质荣誉,先后获得国家重点软件企业、国家高新技术企业、中关村高新技术企业等资质,参与了国家、行业标准的起草工作。2020年,获评工信部国家专精特新“小巨人”企业;2021年,获评工信部“新一代人工智能产业创新重点任务揭榜优胜单位”,系全国唯一一家获此殊荣的AI数据企业。

此外,数据服务生产过程中对个人隐私信息的安全保护,是海天瑞声一直坚守的生命线。公司配备了专业的数据保护团队及审查机制,采取严格的人员权限管理、实时监控等措施,充分保障了数据的安全可控。对隐私保护的高度重视,使得海天瑞声取得了一系列国际国内权威安全认证证书,日前获得的ISO/IEC27701被BSI(英国标准协会)称为“重要的全球性隐私保护标准,具有最严苛的资质审核”。

募投项目与估值

海天瑞声本次科创板IPO拟公开发行不超过1070万股,拟募集资金约7.66亿元,主要投向自主研发数据产品扩建项目(2.49亿元)、一体化数据处理技术支撑平台升级项目(2.51亿元)、研发中心升级建设项目(1.66亿元),并补充流动资金(1亿元)。

估值方面,由于公司同行业竞争对手均未上市,从主营业务和上市板块的相关性出发,参考招股书,选取了荣科科技、彩讯股份、天玑科技、四方精创、恒生电子、用友网络、万兴科技、泛微网络等作为可比公司。Wind数据显示,8家可比公司PE(TTM)算术平均值为65倍左右。

考虑到科创板的溢价率和公司未来的成长性,我们给予海天瑞声35倍-40倍估值。海天瑞声过去四年营业收入复合年增长率超过25%,预计2021年将保持同等增速,按同等盈利水平计算,对应的每股价格区间为84元-96元/股。

(怀新投资)(CIS)

声明:证券时报力求信息真实、准确,文章提及内容仅供参考,不构成实质性投资建议,据此操作风险自担。