CFTime專訪|商湯科技料首季推出廣東話大型語言模型 揭一原因亞洲地區發展AI比歐美優勝

商湯科技

ChatGPT在香港普及程度日益廣泛,甚至成為打工仔上班的必需品。但在市場上要找到廣東話的LLM卻少之有少。去年在香港成立的商湯科技(020)公佈,推出人工智能(AI)大模型體系「日日新」,可用於自然語言處理、圖片生成等大模型。商湯科技亞太區香港總經理周宏謙接受 CFTime 專訪時,談到今年的發展大計。 包括即將推出大型廣東話LLM。

想知什麼是LLM,即睇!

商湯科技周宏謙:發展廣東話LLM係好大嘅challenge

周宏謙向CFTime記者提到,現時很多地方的LLM,都是以英文為主,「95%的香港人其實都是習慣用廣東話交談,我哋覺得AI如果要普及化,就應該用人最自然的語言去做溝通。」他指出,作為香港土生土長的AI公司,「我們就有責任去做依件事。」

CFTime專訪|商湯科技料首季推出廣東話大型語言模型 揭一原因亞洲地區發展AI比歐美優勝
商湯科技曾推出多款人工智能教材。

掌握最新加密市場動態與 AI (ChatGPT)新聞與資訊,請即追蹤 CFTime Facebook 及 Linkedin

去年4月,商湯公佈大型語言模型「商量 · SenseChat」,具備語言理解、生成能力,其廣東話版本預計在今年第一季推出。

周宏謙指出,LLM正在不斷改良,仍有很多可以完善私地方,為仍未決定最終推出日期的主因之一,「如果大家都覺得係好嘅,我哋就可以快啲推出」。他亦坦言,對比國語及英文,廣東話的LLM發展難度明顯較大,「做語言模型,就是資料量越多越好,全世界英文的語料當然是最多的,去到中文其實已經少好多,廣東話就更少。」而香港人溝通裡面,不少都會中英混雜,「依個都係一個好大嘅challenge。」

CFTime專訪|商湯科技料首季推出廣東話大型語言模型 揭一原因亞洲地區發展AI比歐美優勝
商湯近年加快拓展汽車市場,包括智能車載系統,亦有自動駕駛技術。

不認為亞洲地區的AI公司發展一定比歐美慢

周宏謙認為,香港對比歐美及其他地區,發展AI「各有各優勢」,不認為亞洲地區的AI公司發展一定比歐美慢,「亞洲AI方面一直都不乏應用場景」,他以商湯為例,在2014年成立時主要以發展智慧城市為主,自三、四年前才發展AI,「亞洲正正係有一個土壤,可以俾我哋試新嘢,接受科技程度都比歐美快。」

看更多:CFTime專訪|掌舖揭香港疫後兩大消費模式轉變 與X pay傳授「2024年零售生存秘笈」

現時AI發展如雨後春筍,不少科技巨頭都爭相發展,周宏謙預料,日後汰弱留強是必經的階段,「真正有技術底蘊,受到行業廣泛採用就會留低。」他指不少公司,到第二、三輪的融資時就無以為繼。」他補充,商湯如內地十多間車廠,更早於2017年與日本著名汽車公司本田簽訂長期合作協議,發展自動駕駛技術合作,「好多時候都係行業需求為主導,當真係有咁嘅需求,我哋先去做。」

想掌握最新加密市場動態與 AI 新聞與資訊,與行業專家交流?即加入CFTime Whatsapp 討論區

商湯科技研究開發投資「基本上係一年多過一年」

記者提及,現時仍處於高息環境,不少公司對投資都相當謹慎,商湯的情況是如何。周宏謙就認為,每年投放在研究開發「基本上係一年多過一年」,「行業或者是不同的應用,或者係接受AI的程度都越來越深,投資自然越來越多。」,他續指,不少重資產的公司,「放喺銀行收息就可以了,但係我哋以科研為主,技術係最重要。」

問到現時香港用戶以使用Poe/ChatGPT為主流,問到當商湯LLM推出後,能否輕易改變用戶的使用習慣。周宏謙就指:「提供到最好嘅用戶體驗,可以俾到客戶知識,自然會贏得市場。」

去年生產力局公佈《香港人工智能產業發展研究》,調查發現僅三成香港AI企業獲盈利、只有四成的受訪企業正在或將應用AI,而行業亦面對算力不足、數據不足及招聘困難三大挑戰。

CFTime專訪|商湯科技料首季推出廣東話大型語言模型 揭一原因亞洲地區發展AI比歐美優勝
座落於大埔科學園的商湯,為園內首間獨角獸並成功上市公司。

早前《施政報告》提出要進一步落實香港創新科技發展藍圖發展,並提出數碼港分階段設立「人工智能(AI)超算中心」。周宏謙就認為,超算中心無論在公營及私營都有很大的需求,認為香港絕對有潛力發展相關市場,「如政府有意欲去建立(超算)中心,有需要我哋都會義不容辭去參與。」

他續指,要香港企業本身都要建立「數據素養」:「一班從業者其實要理解新嘅technology,點樣融合喺現實嘅業務度,業務上改革要一步步去做。」,他建議企業「早些少engage,因為其實你做innovation,很多時候你都會try an error(試錯),唔可以一步登天。」至於普羅大眾,亦要忍受新產品不完善的地方。

近日不少AI公司都因為版權問題遭控告,周宏謙認為普羅大眾應有共識要如何處理這方面的問題,指立法規管是大勢所趨,「咩data可以用,咩data唔可以用,版權又點樣去處理」。他預料,半年內應該有大方向。

zh_CN简体中文