全球首本AI基礎教材,怎麼把機器的“腦回路”教給高中生?

2018-07-08 18:16

全球首本AI基礎教材,怎麼把機器的“腦回路”教給高中生?

作者:知風發佈時間: 2018-05-22 07:00

圖片來源:攝圖網

2017年7月,國務院發佈《新一代人工智慧發展規劃》,明確提出應逐步開展全民智慧教育專案,在中小學階段設置人工智慧相關課程,並建立新一代人工智慧基礎理論體系。

2018年4月28日,華東師範大學逸夫樓的禮堂裡座無虛席,隨著舞臺上的“書”被翻開,全球首本面向中學生的人工智慧教材《人工智慧基礎(高中版)》宣告問世

這本教材究竟是怎麼誕生的?艱深的人工智慧知識,該通過怎樣的課程內容教給高中生?作為一門全新的課程,學生和老師們又對此作何感想呢?芥末堆在拿到教材後,對上述問題做了探討。

九個章節都講了什麼?

這本教材的主要目標,就是讓高中生有機會對人工智慧這一前沿技術初窺芳容。據執行主編林達華透露,該教材著重於AI的基本思想、基礎知識以及常用演算法和工具的講授,通過學習,中學學生可以具備AI應用的基本能力。

圖片來源:商湯科技

AI這門學科包含了數學、物理等多學科知識,如何讓零基礎的高中生上手呢?

《人工智慧基礎(高中版)》在章節設計上,共有“人工智慧:新時代的開啟”、“牛刀小試:察異辨花”、“別具慧眼:識圖認物”、“耳聽八方:析賞音樂”等九章,一步步讓學生瞭解AI的基本原理。

簡單來說,九個章節的主線就是AI從監督學習到無監督學習、再到強化學習的過程,在難度和深度上循序漸進。監督學習指AI需要人類先對資料進行標注,才能區分事物類別;無監督學習則更“聰明”,AI不需要人類標注資訊,通過演算法就能自動分類。

教材第一章從未來生活圖景的開始,介紹了AI發展簡史、在各行業中的應用與機器學習的基本概念;第二章介紹了AI對事物進行分類的機制;第三、四、五章分別介紹了AI識別圖像、音訊、視頻的原理。以上章節主要側重AI的監督學習,第六章開始引入AI無監督學習的概念,講述了AI利用K均值演算法來達到無師自通的效果;第七、八章則介紹了主題模型、生成對抗網路這另外兩種無監督學習方法;最後一章則在AI自我學習的基礎上更進一步,利用AI圍棋程式阿爾法元介紹了強化學習的概念。

通過鳶尾花理解AI“腦回路”

那麼,這本教材是如何介紹人工智慧原理的呢?我們以書中AI識別鳶尾花為例子來一探究竟。

鳶尾花(iris)的兩個品種變色鳶尾(iris versicolor)和山鳶尾(iris setosa)有著形狀和色彩相似的花瓣和萼片,一般來說,變色鳶尾花瓣較大,而山鳶尾花瓣較小。

(示例圖片均來自教材)

AI識別兩種鳶尾花,首先需要提取花的特徵,然後再將特徵數值輸入訓練好的分類器中,分類器根據特徵做出預測,輸出鳶尾花的品種。

首先,我們引入特徵(feature)的概念,特徵是指可以對事物某些方面特點進行刻畫的數位或屬性。因為變色鳶尾和山鳶尾形狀色彩相似但花瓣大小不一,所以我們利用其花瓣長度和寬度特徵來區分品種。

測量出的花瓣的長度和寬度,用x1,x2分別表示,(x1,x2)這組資料在數學中就是向量。把描述一個事物的特徵數值組織在一起,就形成了特徵向量(feature vector)。一朵鳶尾花的長度為1.1釐米,寬度為0.1釐米,這朵鳶尾花的特徵就用(1.1,0.1)表示。

把特徵向量在坐標系中標出,這些點被稱為特徵點(feature point),共同構成特徵空間(feature space)。至此,我們完成了AI識別的第一步特徵提取。

從特徵向量到最終預測類別,AI還需要一個函數,這個函數就叫分類器。我們用+1和-1分別代表變色鳶尾和山鳶尾,再用一條直線0.5x1+x2-2=0來劃分坐標系中的兩個區域。

2.jpg

特徵點(x1,x2)落在右上區域輸出+1,代表變色鳶尾,落在左下區域輸出-1,代表山鳶尾。這個規則代表的分類器可以用以下函數表示:

3.jpg

以上這一分類器被成為線性分類器(linear classifier)。訓練線性分類器有兩種常見的演算法:感知器和支持向量機。

感知器(perceptron)通過被誤分類的訓練資料調整現有分類器的參數,不斷減少誤分類:

8.jpg

如下圖所示,兩條分類直線都能區分兩種鳶尾花,誰更準確呢?

6.jpg

橙色陰影區域更寬,能區分更多的特徵點,所以準確度更高。而支持向量機(support vector machine,SVM)就是指特徵空間上分類間隔最大的分類器。

分類器通過兩種演算法訓練之後,還需要進行測試。統計分類器分類正確的樣本數與總數,可以得到一個分類準確率,準確率最高的分類器就是最優的分類器。

通過測試這一階段,AI就能在人類輸入鳶尾花花瓣長度和寬度的條件下,給出準確的分類結果。

我們用一個分類函數解決了二分類問題,除了區分一種類別中的兩個分支,生活中我們還需要對多種類別進行分類,比如區分牡丹、荷花、梅花等。

11.jpg

在區分三種花的二分類函數f1,f2,f3基礎上,教材還引入歸一化指數函數的概念,將輸出轉化為概率。借此,分類器不僅能告訴我們這是牡丹還是梅花,還能告訴我們有多大的概率它是牡丹或梅花。

通過以上這個AI識別花朵的例子,我們可以瞭解到AI對事物的分類過程,分為特徵提取、分類器的訓練和測試應用三部分。AI的這個判斷邏輯,在我們生活中已有許多實際應用的例子,比如相機中的人臉檢測、醫學中的癌細胞檢測等。

教材難嗎?高中生這麼說

讀到這裡,想必讀者對這本教材的內容和難度有了自己的感受,那麼高中生又是怎麼想的呢?

記者隨機採訪了十幾位學生對AI教材的看法。在採訪中,多數學生表示沒聽說過這本教材,學校也尚未開設相關課程。

在翻閱了AI教材之後,大部分受訪學生表示難度還能接受。清華附中一名高二學生說,“畢竟數學的東西不是很多,更多的是文字性的概念描述;而且它作為選修課,難度太大也不行。”北京一七一中學一名學生表示,“教材總體難度感覺還行,不過學好它也不容易,裡面有涉及一些大學階段才學到的知識。”

但也有部分學生表示這本教材有一定挑戰性。一名清華附中的學生認為,“乍一看看不太懂,還是有點高深,自學的話額外成本會比較高,需要老師的輔導。”北京二中一名學生粗略地流覽完教材後說,“我感覺我看不太懂,即便有老師輔導也不簡單,不過我還是很有興趣去學。”

微信图片_20180521193003.jpg

教材截圖

談及AI教材,學生們基本持肯定態度,表示如果開設這門課程選修者應該不在少數。清華附中一名正自學人工智慧的高一學生說,“將來如果學習人工智慧的話,我想在現階段先學點基礎,然後在大學系統性地學習,現在能提供一個機會還是挺好的。”

對於該門教材的教學,一名受訪學生將之與學校開設的資訊選修課做了對比:“我們學校資訊課一般不用教材,學VB、Java時都是老師先把課件做好,再給我們講。類似地,我想AI的課上老師們也會發揮出自己的教學特色。”由於AI是一門全新的課程,學生們均表示老師首先要接受一定的培訓,然後再帶學生一起學。

“要探索在標準之外,學生能走多遠”

關於教材的難度,記者還諮詢了一位元對AI有一定瞭解的程式師。該程式師認為,該教材缺乏前置知識介紹,直接上手的話對高中老師的要求比較高;其次,教材中的很多知識大學才能學到,對普通學生來說還是有一定的難度。

在編寫之初,編者在難度把控方面就有過爭論:如果介紹AI的運作原理,似乎過於艱深;只是科普性的介紹而不涉及數學和演算法,又顯得太淺。後來,編者達成了共識,將教材目標定位為傳遞人工智慧的基本思想和理念,興趣與知識並重,並以實踐為導向。

對此,記者採訪了編者之一、上海交大附中彭禹老師。彭禹表示,“原理並非一定就很難,而概念介紹也不一定簡單;概念學習是所有學習的基礎,概念理解也有深淺之分,一定程度上也依賴老師如何去闡釋。”

對於教材部分內容超綱的問題,彭禹解釋道,“實際上,國家課程標準這個‘綱’,只是最低的要求,不能因為超綱就不學習了。作為一名教育者,還要探索在這個標準之外,學生還能走多遠。”

彭禹認為,“教材中涉及到一些高等數學的知識,但區分‘高中知識’和‘大學知識’並沒有多大的意義,知識沒有高中大學之分。實際上,學生只要有初高中的代數知識和語文基礎,就能讀這本書,加上老師的輔導,我想弄懂它是不成問題的。”

中國主要在兩個階段講授人工智慧課程,一是入門科普介紹,二是研究生時期專業化學習,中間缺少一個奠基和進階。彭禹表示,這本教材的主要優點,就是以深入淺出的方式彌補了這一空缺;由於還未推廣落地開來,談其缺點還言之尚早。

一堂“手腦結合”的AI

將來逐漸開設的人工智慧課堂,會是怎樣一番授課場景呢?

首先,人工智慧概念的講授是必不可少的根基。對基礎較為薄弱的高中生來說,弄懂各種概念並不容易。為了便於學生理解,這本教材中加入了大量具體的例子和圖表,形象地描述概念知識。教材在編寫之初就定下規矩:“每一段話都必須自己撰寫,每一幅教學示意圖都必須自己設計。”

9.jpg

電腦將小格子對應的顏色轉化為數位矩陣

10.jpg

圖元點的運動方向轉化為光流圖

其次,教材穿插了大量的補充介紹知識點,比如向量的基本運算、簡單概率、和初級的優化思想等,便於學生學習。執行主編林達華表示,學習本書的概念和知識並不需要很深的數學,通過數學知識點的補充,能夠滿足中學教學的需求。

微信图片_20180521185526.jpg

向量間的卷積運算

微信图片_20180521185530.jpg

感知器學習演算法

最後,通過思考討論題和實驗題,加深學生的理解。由於AI這門學科應用性非常強,與其他傳統教材不同,AI教材以“手腦結合”為主要學習方式,每一章都有一個主線任務,引導學生學習相關的知識的同時,讓學生通過思考、討論、實驗練習,達到學以致用的效果。

微信图片_20180521185824.jpg

教材裡的實驗題

為配合全書22套實驗,商湯科技還開發了一個人工智慧實驗平臺。該平臺選用在AI領域使用最廣泛的Python語言,支援深度學習模型訓練和演算法的定制擴展。學生可利用該平臺完成各種課堂實驗、作業、競賽及自主創新項目。

編者彭禹表示,實驗平臺不是單純為了做實驗,也不是培養搭積木般的動手能力,而是讓學生通過實驗瞭解AI背後一套複雜的原理機制。學生可以通過科學的實驗方法和嚴謹的邏輯結構,明白AI不是故弄玄虛的事物。

在教學形式上,AI的課堂主要還是以PBL(Project-Based Learning,基於專案學習)的方式來教學,學生AI專案的設計邏輯、完成度都可以作為評價標準。

未來人工智慧教學體系第一塊磚

據商湯科技介紹,人工智慧教學體系涵蓋《人工智慧基礎》教材、教輔材料、教師培訓與認證、教學實驗平臺、人工智慧實驗室和全國中小學生人工智慧大賽六大模組。

未來三年,商湯科技希望和全國一、二線城市的50%以上的示範性高中,以《人工智慧基礎》為標準教材,開授人工智慧課程。同時還將面向學校提供的培訓服務,包括人工智慧基礎課程教師培訓、人工智慧實驗平臺教師培訓、智慧型機器人教師培訓等。商湯科技還將結合教材中的知識點,與華東師範大學、商務印書館一道,在中小學開展人工智慧教師培訓、中小學人工智慧實驗室建設、智慧校園建設等多個場景,對教育行業進行賦能。

目前,上海市市西中學已經開始基於AI教材內容對學生進行授課。而素有全球青少年科學競賽“世界盃”之美譽的國際科學與工程大獎賽(ISEF),目前已經被人工智慧這一學科佔據了40%。可以看到,雖然AI教材離全面普及還有很長的路要走,但AI一定是未來的發展方向,AI課程也將會遍地開花。這本教材,或許是構建未來人工智慧教學體系的第一塊磚。

1、本文是芥末堆網原創文章,轉載可點擊 芥末堆內容合作 瞭解詳情,未經授權拒絕一切形式轉載,違者必究;
2、芥末堆不接受通過公關費、車馬費等任何形式發佈失實文章,只呈現有價值的內容給讀者; 
3、如果你也從事教育,並希望被芥末堆報導,請您 填寫資訊告訴我們。

來源: 芥末堆

 

 

 

—————

返回