當不方便聽語音時,點下“轉(zhuǎn)文字”便能直接獲得語音信息的文字翻譯;當開車時,對著手機直接說出目的地便能直接獲取導航路線;當進入寫字樓時,對著智能安檢攝像頭刷臉即可通過……
隨著技術(shù)的不斷迭代,人類已悄然邁入智能時代,機器能夠像人一樣,會聽、會看、會說、會動、會思考及會學習,更讓人類生活變得豐富多彩起來。智能時代,人們通過智能語音系統(tǒng)、計算機視覺系統(tǒng)、自然語言處理系統(tǒng)發(fā)送簡訊、操縱汽車、遙控設備,這一切主要歸功于智能語音、計算機視覺、自然語言等相關人工智能領域的應用發(fā)展。
“而我們所做的事情,則是作為人工智能產(chǎn)業(yè)的‘基石’,為產(chǎn)業(yè)鏈的技術(shù)層和應用層源源不斷地提供對其至關重要的AI訓練數(shù)據(jù),用戶看不到我們,卻在時時刻刻體驗著我們的基石作用。”海天瑞聲董事長賀琳說。據(jù)悉,該公司產(chǎn)品和服務已獲得騰訊、阿里、百度、字節(jié)跳動、微軟、三星、亞馬遜、科大訊飛、商湯科技、??低暤葒鴥?nèi)外優(yōu)質(zhì)客戶的認可。
8月13日,海天瑞聲登陸科創(chuàng)板,公司將借助資本的力量強化雙翼,飛向更廣闊的智能天地。
訓練數(shù)據(jù)“大王”
海天瑞聲成立于2005年,是一家專注于為AI算法模型訓練提供數(shù)據(jù)產(chǎn)品及解決方案的服務商。16年來,公司持續(xù)投入重金做研發(fā),目前主營業(yè)務包括訓練數(shù)據(jù)定制服務、訓練數(shù)據(jù)產(chǎn)品及訓練數(shù)據(jù)相關的應用服務三大板塊,業(yè)務領域涵蓋了智能語音、計算機視覺、自然語音等AI核心領域,構(gòu)筑起堅實的技術(shù)壁壘,持續(xù)為客戶提供高質(zhì)量的訓練數(shù)據(jù)產(chǎn)品及服務,始終努力推動著AI技術(shù)在全球各行業(yè)落地的進程。
隨著智能客服、智能家居、智能手機助手等應用產(chǎn)品的廣泛普及,琳瑯滿目的人工智能應用熱潮背后,是迅猛發(fā)展的人工智能技術(shù)。而在技術(shù)背后,扮演至關重要角色的則是大規(guī)模的專業(yè)訓練數(shù)據(jù)集。數(shù)據(jù)資源的規(guī)模和質(zhì)量,在很大程度上決定了各種人工智能技術(shù)及應用的廣度和深度,從而影響著AI應用/產(chǎn)品的落地及用戶的體驗。
“數(shù)據(jù)已經(jīng)成為一種生產(chǎn)要素,前提是要把人類世界的信息轉(zhuǎn)化為計算機可以識別的方式。”賀琳介紹說,人工智能行業(yè)發(fā)展涵蓋了三大核心要素——算法、算力及數(shù)據(jù)。如果把發(fā)展成熟的人工智能行業(yè)比作菜肴,那么數(shù)據(jù)就是食料,算法是煎、炒、烹、炸、燉等各種烹飪方法,算力則是燃氣灶、菜刀、鍋、勺等烹飪工具。要想做出一道色香味俱全的菜肴,三者缺一不可。
賀琳所帶領的海天瑞聲正是我國領先的人工智能訓練數(shù)據(jù)專業(yè)提供商。公司自成立以來,始終致力于為AI產(chǎn)業(yè)鏈上的各類機構(gòu)提供算法模型開發(fā)訓練所需的專業(yè)數(shù)據(jù)集。
根據(jù)招股書顯示,目前海天瑞聲所提供的訓練數(shù)據(jù)覆蓋智能語音(語音識別、語音合成等)、計算機視覺、自然語言等多個核心領域,全面服務于人機交互、智能駕駛、智慧城市等多種創(chuàng)新應用場景。
智能語音稱雄天下
據(jù)介紹,海天瑞聲在智能語音方面可謂獨步天下。公司建立了成熟的發(fā)音詞典構(gòu)建流程、積累了深厚的語音語言學基礎研究成果。截至目前,公司的產(chǎn)品/服務已覆蓋全球160余個語種/方言,并已積累下超過100個語種/方言的發(fā)音詞典,累計詞條數(shù)超過1000萬條,可構(gòu)建高質(zhì)量的智能語音訓練數(shù)據(jù)集群。
“我們的許多客戶都是全球性的大型科技公司和頭部人工智能企業(yè),他們的產(chǎn)品需要推廣到世界各個角落,所以產(chǎn)品中的語種/語言功能也需要能夠匹配其所布局的地方區(qū)域。”賀琳介紹說,每一種語言的研究、開發(fā)都需要花費大量的時間及成本,不同語言涉及的音素集、發(fā)音規(guī)則等設定,都需要專業(yè)的語言學家聯(lián)合AI工程師一起來共同研究完成。
除了豐富的語言能力,公司依托自主開發(fā)的一體化數(shù)據(jù)處理平臺,高質(zhì)、高效地采集與處理大規(guī)模訓練數(shù)據(jù)。一體化數(shù)據(jù)處理平臺需要解決三方面的問題:一是如何構(gòu)建底層算法結(jié)構(gòu),使人機結(jié)合處理數(shù)據(jù)的能力發(fā)揮到最優(yōu),最大程度提高數(shù)據(jù)處理效率;二是如何通過對平臺和工具的反復打磨,使數(shù)據(jù)生產(chǎn)流轉(zhuǎn)效率最大化,令訓練數(shù)據(jù)的開發(fā)可以真正達到規(guī)?;蝗侨绾巫畲蟪潭缺U蠑?shù)據(jù)安全。海天瑞聲通過多年的深耕和持續(xù)的研發(fā)投入,擁有了功能強大的一體化處理平臺,實現(xiàn)了訓練數(shù)據(jù)安全、合規(guī)生產(chǎn)的規(guī)?;?。
上述羅列的“特技”,正是海天瑞聲區(qū)別于業(yè)內(nèi)其他數(shù)據(jù)服務商的本質(zhì)特征,也是在經(jīng)年累月的努力下為自己打造的深厚壁壘。公司也成為目前國內(nèi)極少數(shù)有能力提供包括希伯來語、烏爾都語、緬甸語等語種數(shù)據(jù)服務的供應商,也是全球擁有自主知識產(chǎn)權(quán)訓練數(shù)據(jù)集最多的企業(yè)之一。
據(jù)賀琳介紹,公司目前在以每年大概十余種語言/方言的速度不斷擴充著公司的專業(yè)數(shù)據(jù)庫,同時不斷迭代一體化數(shù)據(jù)處理平臺,加入各類新的處理功能。多年積累的核心技術(shù)和專業(yè)服務能力,使得公司能夠更大規(guī)模、更有效率、更加精準地生產(chǎn)訓練數(shù)據(jù),在提升自身產(chǎn)出效率的同時也有效提高了訓練數(shù)據(jù)對于客戶算法模型的改善、優(yōu)化效果。
數(shù)據(jù)是算法發(fā)展和演進的“燃料”
賀琳早年在中科院聲學研究所工作,彼時,她與身邊眾多研究人工智能的好友們都遭遇一個煩惱:基礎訓練數(shù)據(jù)的缺乏。沒有訓練數(shù)據(jù)作為支撐,AI技術(shù)及其應用的研發(fā)工作就很難開展。當時的他們會時常聚在一起來討論這個問題該怎么去解決。隨著算力的突破,數(shù)據(jù)的緊缺問題更加迫在眉睫。
“當時我認為這是未來的一個方向,因為大家在工作中都會遇到這樣的瓶頸。一些企業(yè)的研究員更想專注于做算法,但又缺乏數(shù)據(jù)。”賀琳表示,所以海天瑞聲應運而生。
賀琳告訴記者:“數(shù)據(jù)是算法發(fā)展和演進的‘燃料’,算法、算力、數(shù)據(jù)這三個要素一定要互相作用,才能使AI行業(yè)得以發(fā)展。近年來,國家從頂層設計層面也非常重視數(shù)據(jù)的發(fā)展,并制定了很多相關的政策,特別是今年,建設人工智能行業(yè)訓練數(shù)據(jù)集、發(fā)展全數(shù)據(jù)產(chǎn)業(yè)鏈已被正式納入國家重點規(guī)劃,可以說數(shù)據(jù)資源的基礎性和戰(zhàn)略性的地位已經(jīng)凸顯。”
事實上,除了提供訓練數(shù)據(jù)產(chǎn)品外,一個專業(yè)高效的數(shù)據(jù)合作伙伴最重要的能力之一是幫助應用商們較為準確地預估投入產(chǎn)出比,找到與整體業(yè)務目標契合的整體服務解決方案。經(jīng)過多年的業(yè)務實踐與發(fā)展,海天瑞聲目前與產(chǎn)業(yè)鏈上的各類機構(gòu)都建立了長期的戰(zhàn)略合作關系,產(chǎn)品和服務已獲得阿里巴巴、騰訊、百度、字節(jié)跳動、微軟、三星、亞馬遜、科大訊飛、商湯科技、云知聲、??低暤葒鴥?nèi)外優(yōu)質(zhì)客戶的認可,建立了廣泛的行業(yè)知名度與影響力。
未來,市場對訓練數(shù)據(jù)的拓展性需求和前瞻性需求均將快速增長。隨著行業(yè)內(nèi)對訓練數(shù)據(jù)需求類型的增加以及對服務標準要求的提高,這就要求包括海天瑞聲在內(nèi)的數(shù)據(jù)服務商能夠保持對行業(yè)發(fā)展趨勢的洞察能力,深刻理解客戶的應用領域及業(yè)務場景,在設計方案過程中考慮到算法對樣本多樣性的需求,保證數(shù)據(jù)方案能滿足機器學習的需求且避免出現(xiàn)與模型的過擬合、欠擬合等諸多問題。
“幫助客戶不在數(shù)據(jù)準備階段走彎路,助推其加速模型訓練、產(chǎn)品落地和迭代更新是海天瑞聲堅守的初衷。”賀琳說,隨著人工智能在全球的快速發(fā)展,對數(shù)據(jù)資源需求將持續(xù)增長。與此同時,不同類型、處于不同發(fā)展階段的企業(yè)及組織對數(shù)據(jù)的需求也逐步展現(xiàn)出差異化、多元化趨勢,因此對人工智能訓練數(shù)據(jù)服務商的資質(zhì)、研發(fā)、產(chǎn)能、質(zhì)控、安全合規(guī)等方面都提出了更高的要求。
用戶驅(qū)動、需求驅(qū)動、實戰(zhàn)驅(qū)動是推動海天瑞聲持續(xù)穩(wěn)步前進的動能。行業(yè)的高速增長,政策的不斷加持,為海天瑞聲增添了更多的成長空間。而登陸科創(chuàng)板,則會獲得更充足的資本力量,助推公司海闊天空任飛翔。
| 23:59 | 金屬空氣電池賽道熱度攀升 |
| 23:59 | 凌志軟件擬收購凱美瑞德100%股權(quán) |
| 23:59 | 遼港股份:做精港口主業(yè) 推動創(chuàng)新... |
| 23:59 | A股公司積極布局源網(wǎng)荷儲一體化項... |
| 23:59 | 深入洞察家庭資產(chǎn)配置需求 太平人... |
| 23:59 | 方直科技擬以1.16億元收購執(zhí)象科技 |
| 23:59 | 存儲產(chǎn)業(yè)鏈上下游迎“超級周期” |
| 23:59 | 我國6G專利申請量全球第一 上市公... |
| 23:59 | 多部大IP電影上映在即 全年票房有... |
| 23:59 | 上市公司競逐商業(yè)航天賽道 |
| 23:59 | 機器人加速進社區(qū) 物管行業(yè)探索“... |
| 23:59 | 10月份標品信托成立規(guī)模環(huán)比增長12... |
版權(quán)所有證券日報網(wǎng)
互聯(lián)網(wǎng)新聞信息服務許可證 10120180014增值電信業(yè)務經(jīng)營許可證B2-20181903
京公網(wǎng)安備 11010202007567號京ICP備17054264號
證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務請仔細閱讀法律申明,風險自負。
證券日報社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
掃一掃,即可下載
掃一掃,加關注
掃一掃,加關注