1. 人工智能自適應教育相關概念闡述
1.1 人工智能自適應教育的概念
運用人工智能、數據挖掘、認知科學、教育學、心理學、行為科學等知識,連續(xù)、實時地收集學生學習數據,根據學習者的學習目標、學習行為、偏好和學習狀態(tài)實時動態(tài)調整和優(yōu)化學習路徑,以達到個性化教學的目的。這種基于AI技術的自適應教育即為人工智能自適應教育,簡稱為智適應教育。
1.2 人工智能定義及其在教育領域的應用
人工智能定義
人工智能是一門綜合了計算機科學、生理學、哲學的交叉學科,是使用機器代替人類實現認知、識別、分析、決策等功能的技術。伴隨著人工智能的三次浪潮,越來越多的中國企業(yè)投入到AI領域的研究和探索中。在國務院發(fā)布的人工智能發(fā)展規(guī)劃中在2030年人工智能核心產業(yè)規(guī)模將超過1萬億元,并將帶動相關產業(yè)規(guī)模超過10萬億元。
人工智能發(fā)展的核心是與行業(yè)相結合,只有賦能垂直行業(yè)的技術才具有市場化價值。通過創(chuàng)造新的用戶價值,解決行業(yè)稀缺資源的痛點與提高原產業(yè)運行效率,人工智能將會為社會帶來可持續(xù)價值。
應用到垂直行業(yè)的人工智能的通用技術主要包括語音識別、自然語言處理與圖像識別。其中語音識別與自然語言處理已經驗證的應用場景有在線教育和呼叫中心;圖像識別中以人臉識別技術發(fā)展的最為迅速,應用的場景最為廣泛,主要應用在安防和金融兩個領域。近幾年,各項通用技術的錯誤率均接近或超越了人類的平均能力。盡管技術還有諸多問題亟待解決,但已能在具體的場景下作為輔助功能提高行業(yè)效率。
人工智能在教育領域的應用
人工智能在學習中可應用在測、練、學、教四個環(huán)節(jié),類別上可劃分為識別類和策略類。AI教育中的識別類包括拍照搜題、智能測評、智能閱卷等,具體應用了圖像識別、語音識別、語義識別等技術;策略類主要是自適應學習系統,主要應用了信息論技術、貝葉斯理論、知識空間、遺傳算法等技術。
1.3 自適應教育概念、分類及發(fā)展歷程
自適應教育概念、分類
自適應教育是一種為學生提供個性化學習的方式,通過追蹤學生如何回答問題,基于其特定行為和答案,推薦相應的學習路徑,以更好地適應學生個人的學習需求,做到因材施教,類別上分為規(guī)則的自適應教育和非規(guī)則的自適應教育。
規(guī)則的自適應教育:具有固定的在線學習順序,系統按照預先設定好的規(guī)則,將內容傳送給學習用戶,無法根據用戶的行為實時反饋和調整學習路徑,無法做到真正千人千面的個性化學習。
非規(guī)則的自適應教育:運用人工智能、數據挖掘、認知科學、教育學、心理學、行為科學等知識,連續(xù)、實時地收集學生學習數據,根據學習者的學習目標、學習行為、偏好和學習狀態(tài)實時動態(tài)調整和優(yōu)化學習路徑,以達到個性化教學的目的。這種基于AI技術的自適應教育即為人工智能自適應教育。
自適應教育發(fā)展歷程
自適應教育學習理念很早之前就存在,其形成通常與 B. F. Skinner 的教學機器和他的程序化學習理論有關,這個理論于 1950s 年代出現,1970s開始通過計算機輔助教學,出現了智能化教學系統。近年來,隨著大數據、人工智能等技術不斷成熟,逐漸從理論走向落地應用,推動了人工智能自適應教育的快速發(fā)展。
1.4 AI教育和自適應教育的關系
AI教育是人工智能技術在教育行業(yè)的垂直化應用,可分為識別類和策略類。自適應教育是一種個性化教育方式,以做到因材施教,分為規(guī)則的自適應教育和非規(guī)則的自適應教育,其中基于AI技術的非規(guī)則的自適應教育,簡稱智適應教育,AI教育中的策略類即為智適應教育。
1.5 人工智能自適應教育分類
根據人工智能自適應教育在學習過程中涉及的環(huán)節(jié)和程度,可分為智適應題庫系統、智適應學習系統。
智適應題庫系統主要涉及學習過程的測、練兩個環(huán)節(jié),公司主要為題庫類、測評類以及作業(yè)類等公司,通過測評學生的能力,根據學生知識狀態(tài)的用戶畫像,提供在線解答、在線練習等服務。智適應學習系統涉及測-練-學-教四個環(huán)節(jié),可以連續(xù)搜集學生學習行為數據,根據對學生當前能力的了解,規(guī)劃學生最優(yōu)學習路徑,并自動推送線上教學視頻等學習內容,實現整個學習過程的閉環(huán)。
2. 人工智能自適應教育行業(yè)現狀分析
2.1 行業(yè)發(fā)展驅動力
行業(yè)發(fā)展驅動力
硬件設施的成熟 |
隨著信息和通信技術的演變,計算機變得越來越小,功能更強大,價格更實惠,為智適應教育被廣泛用于不同的環(huán)境,高效地進行教學和培訓,奠定了設備基礎。 |
基礎數據的積累 |
云計算、云存儲的發(fā)展降低了存儲成本,使得大量的數據得以保存下來,數據的積累為模型訓練和算法奠定了基礎。 |
底層技術的發(fā)展 |
人工智能、深度學習等技術的發(fā)展,逐漸從理論落實到具體的領域應用,為智適應教育的發(fā)展提供了技術支持。 |
國家政策的推動 |
國務院發(fā)布的《新一代人工智能發(fā)展規(guī)劃》中提到要圍繞教育、醫(yī)療、養(yǎng)老等迫切民生需求,加快人工智能創(chuàng)新應用。政策的支持將加快推動新型教育體系、智能校園的建設。 |
2.2 中美發(fā)展對比
由于中美兩國教育文化的不同,人工智能自適應教育行業(yè)的發(fā)展在內容生產、商業(yè)模式和應用場景上有很大差異。美國的人工智能自適應教育起步早,技術相對成熟,但總體上仍處于高等教育實驗適應性學習早期階段。美國以平臺型公司為主,內容上與大型出版商合作,主要用戶是高等學校等B端用戶;國內起步較晚,人工智能自適應教育公司不僅研發(fā)系統,而且自己組建團隊研發(fā)內容,主要用戶為K12中小學生。
人工智能自適應教育中美發(fā)展對比
|
中國 |
美國 |
發(fā)展背景 |
? 應試教育發(fā)達,對成績提升需求迫切,課外付費輔導行業(yè)發(fā)達 ? 智適應教育起步較晚,技術基礎薄弱 |
? 種族繁多,學生擁有多元化背景 ? 智適應教育起步早,技術相對成熟 |
內容生產 |
?內容上,自適應系統公司自己組建團隊研發(fā)內容;教材版本眾多,不同的教材知識匹配不同,知識點更加細致,知識體系一般為幾百萬的量級 |
? 內容上,由學校和出版商提供,知識產權明確,經過多年培育,內容質量更優(yōu);知識體系量級一般為幾千幾萬數量級 |
應用場景 |
多應用在K12基礎教育階段 |
多應用在高等教育 |
2.3 關鍵發(fā)展因素
內容 |
?對教學大綱和課程要有足夠深入的理解,內容要與教育目標和課程高度吻合。 ?知識圖譜的顆粒度、知識點的分拆、標簽的級別要足夠精細,知識點之間的關聯度要足夠細致,以快速精準定位出學生薄弱的知識點,推薦學習路徑。 |
數據 |
?單點而雜亂的用戶數據價值不大,需要搜集用戶整個學習過程的數據,算法才能在測-練-學-教的整個過程中發(fā)揮作用,結合當前和歷史的學習行為數據分析,推薦最優(yōu)學習路徑。有效的學習行為數據其特點:用戶行為數據的連續(xù)性、數據上下文的前后關聯度。 ?隨著有效用戶連續(xù)數據的積累,不斷優(yōu)化數據模型,從而提高精準度和用戶測評的速度。 |
技術 |
?用到遺傳算法、知識空間、貝葉斯定理等技術,需要策略型AI的數據科學家。圖像識別、自然語言處理等識別類AI技術難以滿足需求。 |
2.4 行業(yè)發(fā)展現狀分析
人工智能自適應教育行業(yè)目前處于處于初步發(fā)展期,產業(yè)鏈不成熟,分工不明確,用戶對人工智能自適應教育認知度低;大小玩家開始入局,對公司團隊的技術-內容-商業(yè)化能力要求高。
行業(yè)發(fā)展現狀分析
市場參與者 |
國內做人工智能自適應教育的創(chuàng)業(yè)型公司主要有三類: ?智適應學習系統服務商,如乂學教育、論答; ?拍照搜題、智能測評等工具類公司,如學霸君、英語流利說; ?英語語言培訓類公司,如朗播網。 上市企業(yè)中做智適應教育的,有傳統中小學教育機構,如好未來、新東方;人工智能語音測評公司,如科大訊飛。 |
公司發(fā)展模式 |
?涉及學習過程的環(huán)節(jié):從測評和練習切入或者涉及學習的全過程; ?服務對象:K12中小學生基礎教育;成人語言培訓; ?商業(yè)模式:toC 面向學生用戶;toB 面向公立學校和輔導機構; ?學科:以數學和英語等學科為主。 |
關鍵因素發(fā)展程度 |
?內容:由智適應教育公司自己做,對教研團隊的能力要求高,且工作繁重,投入成本高; ?數據:測試和練習的單點學生行為數據豐富,學習和教學的數據 缺失,有效的結構化的連續(xù)性數據稀缺; ?技術:技術不成熟,策略型數據科學家人才稀缺。 |
2.5 產業(yè)鏈分析
人工智能自適應教育行業(yè)產業(yè)鏈分為上游的內容研發(fā)和數據采集,中游的產品研發(fā)和推廣,下游的用戶。目前,產業(yè)鏈各環(huán)節(jié)分工不明確,從內容研發(fā)-數據采集-產品研發(fā)-推廣等各個環(huán)節(jié),人工智能自適應教育公司大都自己來做。隨著行業(yè)不斷發(fā)展成熟,產業(yè)鏈分工有望逐步明確。
3. AI自適應教育行業(yè)資本市場表現情況
3.1 投資事件整體情況
2017年,作業(yè)幫、英語流利說、學霸君、乂學教育、極課大數據均獲得了億元以上的融資額度,使得該年無論是融資總額還是平均投資額均達到歷史新高。資本的青睞加速了AI教育的發(fā)展。
3.2 人工智能教育投資事件細分領域概覽
由于行業(yè)主要處于早期,人工智能教育各細分領域的平均融資額在2000萬元人民幣左右。教輔工具項目獲得的融資事件數量最多,超過第二名教育機器人兩倍之多。拍照答題類的項目融資事件數量雖少,但由于幾筆后期的大額融資,平均額度達到了第一,超過1億人民幣,遠遠領先于其他領域,可以看出人工智能教育中教輔工具和拍照答題更成熟。
人工智能自適應教育項目的融資事件數量很少排在倒數第二的位置,但平均融資額卻達到了第二??梢婋m然行業(yè)處于早期階段,但相對于其他細分領域來說更受資本的青睞。
3.3 人工智能教育項目地域分布情況
人工智能教育項目主要集中分布在北京、廣東、上海等一線省市,其中北京最多,占比高達37%。人工智能自適應教育項目也是主要集中在一線省市,和人工智能教育比起來,廣東省占比有所下降。排名前三的是北京、上海和浙江。
4. 國內人工智能自適應教育代表企業(yè)分析
4.1 一起教育科技
一起教育科技是全球領先的K12智能教育平臺。一起教育科技致力于用先進的教育科技、優(yōu)質的教育內容和持續(xù)的教育熱情,為K12階段的學校、家庭、社會教育場景,提供更為高效、美好的產品和體驗,開啟了智能教育新時代。
一起教育科技認為知識點掌握只是學習的開始,學科能力也只是個性化學習路徑的中間過程,最終的目的是掌握舉一反三的跨學科綜合能力。這種能力體系的建設依賴于豐富的素質教育內容和智能診斷、智能推薦等人工智能技術的結合。
在Socrates智能學習系統當中來于同步的是知識,高于同步的是能力,由算法構建知識點和能力的結構體系。在知識層面不超綱、不超前,讓學生用更少的時間、更有效的練習,達成知識點的掌握和跨學科思維能力的建設,學習知識的同時獲得終身受益的思維方式。
4.2 乂學教育
乂學教育成立于2015 年,是國內一家敢為天下先的人工智能自適應網絡教育公司。截止目前,乂學已經在全國20多個省市自治區(qū)的100多個城市開設了500多家學校,2600多名教職員工。乂學3輪融資累計超過3億元,SIG、NGP、景林資本、國科嘉和(中科院)、青松基金、新東方教育集團、好未來教育集團、正和島、俞敏洪個人等聯合投資。
乂學教育成功開發(fā)了國內開創(chuàng)性的擁有完整自主知識產權、以高級算法為核心的自適應學習引擎。就像AlphaGo模擬圍棋大師,乂學AI系統模擬特級教師給孩子一對一量身定做教育方案并且一對一實施教育過程,比傳統教育效率提升5到10倍。乂學教育在紐約設計了人工智能教育實驗室,還與斯坦福國際研究院(SRI)在硅谷成立了人工智能聯合實驗室。
4.3 作業(yè)盒子
作業(yè)盒子是一家專注K12互聯網教育領域的公司,通過接管K12領域學生的作業(yè)場景,連接老師與學生,記錄、生成學生的學習知識圖譜,基于大數據,幫助老師因材施教。目前作業(yè)盒子已經推出了兩款產品:針對初高中的“作業(yè)盒子”和針對小學的“速算總動員”。產品自上線以來,已經在北京、上海、哈爾濱、太原等400多個城市、70000余所學校投入使用。
4.4 學霸君1對1
學霸君1對1是學霸君旗下在線一對一輔導品牌,隸屬上海謙問萬答吧云計算科技有限公司。基于學霸君100億次搜題數據、學生課堂反饋數據,精準分析學生的知識點掌握情況,構建知識體系,實現“全局可細分,垂直可訓練”。
4.5 高木學習
高木學習是全球領先的人工智能教育引擎及平臺提供商,致力于提升人類知識學習的效率?,F階段聚焦于K12階段,打造AI Tutor輔助學生學習,為學生全局優(yōu)化其學習路徑,培養(yǎng)學生元認知能力。高木學習打造了通用知識學習引擎,基于用戶行為數據反饋,AI Tutor能不斷演進對知識體系的理解。
公司總部位于深圳,創(chuàng)始團隊畢業(yè)于英國帝國理工、美國加州理工、美國哥倫比亞大學等世界名校;技術團隊由聯合創(chuàng)始人歐洲科學院院士、英國皇家工程院院士郭毅可教授領銜。高木學習提供“人機共教”教與學解決方案,以解放教育生產力為目的,目前已服務近680家學校及大型教培集團,超過60萬學員,積累學情數據量超5.1億條,并完成松禾資本,深圳投資控股集團等國內頂級資本的三輪VC融資,公司估值超3億元。
高木學習已與華南最大的教輔集團卓越教育,河南最大教育集團晨鐘教育等國內數百家大型教培集團形成戰(zhàn)略合作。公司獲得“2018胡潤百富中國最具投資價值企業(yè)百強榜單”、“深圳人工智能百強企業(yè)”等榮譽稱號。
5. 國外人工智能自適應教育代表企業(yè)分析
5.1 Knewton
Knewton是一家人工智能自適應學習平臺公司,2008年由Jose Ferreira(自適應教育這一名詞的締造者)創(chuàng)立于美國紐約,目前估值近10億美金。核心產品是自適應學習引擎,在學生學習數據搜集、個性化學習內容推送等技術上處于世界領先地位。其目標是為發(fā)行商、學校及全球的學生提供預測性分析及個性化推薦。其學習效果經過數次十萬人次以上的實驗和實地使用的顯著性論證,得到國際教育界的廣泛引用,是自適應領域的標桿型企業(yè)。
Knewton致力于做一個人工智能自適應學習平臺,自己不提供內容,與學校、出版社等內容生產方合作。在數字化自適應學習課程中,Knewton將合作方的內容通過API嵌入到自己的系統中,其人工智能自適應學習平臺通過連續(xù)收集學生行為數據,實時響應學生在系統中的活動,學生完成某項活動后,系統自動推送學生進行下一個活動。
5.2 ALEKS
ALEKS是一家基于人工智能引擎的自適應學習系統服務商,于1996在美國成立,2013年6月被McGraw-Hill公司收購。它根據每個學生優(yōu)勢項和弱項提供個性化學習體驗;系統應用于K12階段、大學的數學、科學和商業(yè)學科。
ALEKS 的產品系統分為定位、準備和學習三階段,程序可反映每個學生獨特的知識狀態(tài),并將每個學生劃分到課程特定的準備和學習模塊中。不同于傳統的標準化測試和書面考試,ALEKS更注重學生的個性化知識缺口,將定位評估與定向學習模塊間無縫過渡,激勵學生取得更高的成績。
5.3 Realizelt
Realizeit為CCFK旗下教育產品,是一家ToB端的自適應教育解決方案提供商,于2007年在美國成立。通過提供智能自適應SAAS平臺、一個大型的內容庫和一個專業(yè)線下團隊,幫助教育機構搭建一個動態(tài)自適應的教育平臺。
Realizeit的產品系統會記錄學習者產生的所有數據,包括學習時間的長短,每個問題的嘗試次數和結果,教師與學習者之間交互的次數和類型,以及外部干預的數據。這個系統有兩個關鍵特點,一是當數據不存在時,系統通過測試學生或者內容做出判斷,第二個特點是在收集數據時保證了數據的準確性、效率和有效性。
6. 行業(yè)發(fā)展核心要素及發(fā)展趨勢
6.1 AI自適應教育行業(yè)發(fā)展核心要素
大數據
人工智能自適應教育建立于海量優(yōu)質的應用場景數據基礎之上。訓練數據的數量、規(guī)模和質量尤為重要,豐富的海量數據集是算法模型訓練的前提。甚至有觀點認為,擁有更海量的數據比擁有更好的算法更重要。受益于移動互聯網的發(fā)展和多樣化智能終端的普及,以及物聯網的發(fā)展和傳感器的大量應用,源自各種設備及互聯網應用的數據急劇增加,大數據迅速發(fā)展。大數據處理技術能在很大程度上提高人工智能訓練數據集的質量,并能優(yōu)化存儲和管理標注后的數據。因此,可以說,海量數據是機器智能的源泉,大數據有力地助推了機器學習等技術的進步,在智能服務的應用中釋放出無限潛力。
并行計算
人工智能自適應教育發(fā)展過程中,有限的運算能力曾是制約行業(yè)發(fā)展的主要瓶頸。從電子計算機出現的早期至今,機器的運算處理能力不斷提升,為人工智能的發(fā)展提供了極大的動力支持。云計算在虛擬化、動態(tài)易擴展的資源管理方面的優(yōu)勢,GPU等人工智能專用芯片的出現,奠定了人工智能在大規(guī)模、高性能并行運算的軟硬件基礎,推動數據處理規(guī)模和運算速度的指數級增長,極大地提高了算法執(zhí)行效率和識別準確率。
深度學
數據和硬件是人工智能自適應教育的基礎,而算法是人工智能自適應教育的關鍵。人工智能發(fā)展史上,兩個轉折點尤其值得關注。一個是研究方法由符號主義轉向統計模型,自此開辟了人工智能發(fā)展的新路徑;另一個是深度學習憑借絕對優(yōu)勢,顛覆了其他算法設計思路,突破了人工智能的算法瓶頸。深度學習即深度網絡學習,它受人類大腦神經結構的啟發(fā),由一組單元組成,每個單元借由一組輸入值而產生輸出值,該輸出值又繼續(xù)被傳遞到下游神經元。深度學習網絡通常使用許多層次,且在每層使用大量單元,以便識別海量數據中極其復雜和精確的模式。深度學習將人類程序員從構建模型的復雜活動中解放了出來,并提供一種更優(yōu)化、更智能的算法,能夠自動從海量數據庫中進行自我學習,自動調整規(guī)則參數并優(yōu)化規(guī)則和模型,識別準確率極高。自學習狀態(tài)已成為機器學習的主流方法。
6.2 人工智能自適應教育行業(yè)發(fā)展趨勢
人工智能在教育中的應用特征為推動人工智能與教育的融合創(chuàng)新發(fā)展指明了方向。在當前國家大力發(fā)展人工智能的政策引領下,不僅要從本質上認識人工智能的核心要素與驅動力,把握其典型應用特征,還要能夠順應其發(fā)展趨勢。以數據驅動引領教育信息化發(fā)展方向,以深化應用推動教育教學模式變革,以融合創(chuàng)新優(yōu)化教育服務供給方式,將是人工智能自適應教育應用的未來發(fā)展趨勢,也是人工智能時代教育發(fā)展的鮮明任務和重要機遇。
以數據驅動引領教育信息化發(fā)展方向
人工智能技術在教育領域的深入應用,推動著信息技術與教育的融合創(chuàng)新發(fā)展??v觀人工智能在教育領域的應用發(fā)展歷程,從早期基于規(guī)則的知識表示與推理,到今天基于深度學習的自然語言處理、語音識別與圖像識別,“智能”的習得已經由早期的專家賦予演變?yōu)闄C器主動學習獲取。除了算法模型的顯著改進,作為模型的訓練數據集,大數據為人工智能添加了十足的動力燃料。大數據智能以數據驅動和認知計算為核心方法,從大數據中發(fā)現知識,進而根據知識做出智能決策。數據已經成為產業(yè)界爭奪的焦點,數據驅動的智能決策與服務已經成為學術界研究的熱點。在教育領域,數據可以解釋教育現象,也可以揭示教育規(guī)律,并能夠預測未來趨勢。數據驅動的方法推動著教育研究從經驗主義走向數據主義和實證主義。因此,教育數據革命已經到來。數據驅動的人工智能將引領教育信息化發(fā)展的新方向。
以深化應用推動教育教學模式變革
人工智能在教育領域取得如此大的成就,技術引領是關鍵。同時,不難看出,人工智能在教育領域的應用具有較強的場景性,也就是說,這種應用是針對教育實踐活動中的具體問題而展開的,具有明確的問題空間和目標導向。也因此,這種由應用驅動的技術與教育的融合發(fā)展,是技術在教育領域中的一種深入應用。如自動化口語測評中,針對具體的語言語音對象,在語音識別技術的基礎上,應用語音測評技術實現對學生口語的自動化評價。人工智能技術在教育領域的深化應用,創(chuàng)設了強感知、高交互、泛在的學習環(huán)境,為學生的知識建構活動提供了良好條件,為創(chuàng)新型教學模式的發(fā)現和運用提供了空間。
以融合創(chuàng)新優(yōu)化教育服務供給方式
人工智能在教育領域中的應用實現了跨學科、跨領域和跨媒體的融合創(chuàng)新。人工智能與神經科學、認知科學、心理學、數學等相關基礎學科的交叉融合,聯合推動了教育人工智能技術的發(fā)展和應用。同時,人工智能本身的發(fā)展,離不開人工智能教育和培訓。而這種教育更需要建立于Steam學科融合的基礎之上。人工智能與教育兩者相輔相成,互相促進??珙I域推理融合了多個領域的數據與知識,奠定了強大的智能基礎??缑襟w感知計算以智能感知、場景感知、視聽覺感知、多媒體自主學習等理論方法為依托,旨在實現超人感知和高動態(tài)、高緯度、多模式分布式大場景感知。人工智能技術與教學內容、教學媒體和知識傳播路徑的多層次融合,突破了傳統教育方式的限制,提供跨學科、跨媒體、跨時空的智能教育服務供給,是建設“人人皆學、處處能學、時時可學”學習型社會的有效途徑。