12月4日,人工智能數據服務公司Graviti「中文名稱:格物鈦(上海)智能科技有限公司」宣布獲得千萬美元級Pre-A輪融資,資方為紅杉中國種子基金、云啟資本、真格基金以及風和資本。
Graviti成立于2019年初,聚焦于人工智能數據服務平臺業務,致力于成長為非結構化數據集存儲、加工、使用的一站式AI數據服務平臺。目前,公司已經建立了人工智能行業所需的數據集管理和標注系統,為行業提供平臺式服務。
公司創始人崔運凱認為,就人工智能三要素(算法、數據、算力)而言,數據的通用性介于算力和算法之間——雖然有計算機視覺、語音等不同種類的劃分,但同類數據具有相通性,能滿足不同企業的相似需求。
換句話來講,Graviti瞄準了人工智能的計算機視覺領域,為該領域企業提供基礎設施,其希望通過提供高效管理和輸出高質量數據服務,加速數據在供需方之間的流通,以幫助企業發展。
畢業于上海交通大學和美國賓夕法尼亞大學的崔運凱,曾在自動駕駛行業“打拼”多年。此前,他曾任Uber無人駕駛部門的Tech Lead Manager,為該部門最早期一批員工。
作為自動駕駛行業的“老兵”,他深知數據質量對行業發展的重要性,因此,自動駕駛被選做公司業務的第一個切入點。
自動駕駛技術在落地過程中,需要依賴積累的大量真實道路場景進行模型訓練,完成場景測試,一旦數據質量不合格,就會浪費大量時間,增加訓練模型成本。而非結構化數據只有通過對相應特征進行提取標注后,才能直接用于模型訓練。
這對標注公司的交付能力和數據處理系統提出了較高要求。今年以前,眾多自動駕駛公司和其他有圖像算法需求的企業正在通過自建標注平臺、尋找外部人力等方式,試圖解決日常標注需求,但其常常受到外包團隊標注質量不穩定、需求排隊等問題的困擾。
與此同時,在資本遇冷的當下,企業往往將更多資金投入主營業務中,對自身標注業務有所忽略,數據標注公司的價值由此顯現。
但想要成為一家合格的數據標注公司,一方面需要開發性能良好的工具,輸出滿足機器學習模型要求的結果,另一方面還要科學運營人力,確保高效產出的同時節約成本。
為此,Graviti自主研發了標注平臺。該平臺一方面可以通過可視化系統展示數據內容,為工作人員呈現簡潔易懂的后臺操作頁面,通過總結分析提升工作效率;另一方面則瞄準薪資平均水平較低的三四線城市的人力市場,能夠在全國范圍內動態分發和管理項目,通過多層質檢、任務自動分發、數據分批交付的流程設計保證項目的完成效率。
據《2019-2020中國人工智能計算力發展評估報告》,預計2023年,中國人工智能基礎架構市場將超過80億美元。具體到數據標注領域,崔運凱估計,2018年國內市場規模在50億元到100億元之間。但就今年的市場情況來看,“每家公司都愿意或開始考慮尋找靠譜的合作伙伴,并為此項服務付費。”崔運凱表示。
毫無疑問,數據標注的市場規模正在不斷擴大。該賽道的明星公司Scale去年的銷售額在千萬美元級別,今年已增長至近億美元。今年8月,這家剛滿三歲、誕生于美國硅谷的公司還宣布完成了1億美元的C輪融資,發展勢頭良好。但由于涉及國家數據,Scale CEO Alexandr Wang已經明確表示會放棄中國市場。
這給了國內企業一定的市場機會。目前來看,國內數據標注企業多成立于2015年,由于大多數公司沒有AI背景,因此服務質量普遍不高。
“服務好所有AI企業”遂即成為Graviti的目標。對于目前的Graviti而言,自動駕駛是其市場切入點,但不是終點。未來,該公司還希望與高精地圖、人臉識別、機器人、智慧城市、智能安防、智能零售等領域客戶展開合作,推動人工智能應用在更多場景落地。
崔運凱預計,國內數據標注市場將在未來兩至三年內成熟。而Graviti的目標,則是在三年內成為行業的重要參與者。
提供標準數據服務外,Graviti也在有針對性地為客戶提供咨詢服務,幫助客戶準備相關價值的數據集和訓練模型,并將訓練好的模型封裝成相應的服務——這同時也是Graviti未來產品布局的重要組成部分。
目前,Graviti擁有來自哈佛、UT Austin、密歇根大學、上海交大、復旦、同濟等高校的多位員工,公司正努力在自動駕駛和其他領域擴張合作場景,努力提升服務質量形成正向循環。
關鍵詞: