一、培訓簡述
課程中通過細致講解,使學員掌握該技術(shù)的本質(zhì)。具體收益包括:
1.掌握OpenCV的使用;
2.理解卷積神經(jīng)網(wǎng)絡(luò);
3.掌握Tensorflow的使用;
4.掌握keras的使用;
5.通過各個應(yīng)用場景的實際經(jīng)典項目案例,深入解讀計算機視覺技術(shù)的應(yīng)用。
二、培訓特色
本次培訓從實戰(zhàn)的角度對計算機視覺技術(shù)進行了全面的剖析,并結(jié)合實際案例分析和探討計算機視覺技術(shù)的應(yīng)用場景,給計算機視覺技術(shù)相關(guān)從業(yè)人員以指導和啟迪。
三、培訓時長
共計3天,每天6課時
四、培訓大綱
日程 |
培訓模塊 |
培訓內(nèi)容 |
第一天
上午 |
OpenCV使用 |
1.安裝opencv
2.圖像處理基礎(chǔ)
3.圖像運算和轉(zhuǎn)換
4.圖像平滑處理
5.圖像梯度
6.圖像邊緣檢測
7.圖像金字塔
8.人臉檢測和識別 |
第一天
下午 |
卷積神經(jīng)網(wǎng)絡(luò)介紹 |
1.CNN架構(gòu)
2.卷積計算
3.卷積的步長
4.池化
5.Padding
6.MNIST網(wǎng)絡(luò)結(jié)構(gòu)介紹 |
第二天
上午 |
Tensorflow使用 |
1.深度學習框架介紹
2.Tensorflow安裝
3.Tensorlfow基礎(chǔ)知識
4.Tensorflow線性回歸
5.Tensorflow非線性回歸
6.Mnist數(shù)據(jù)集合Softmax講解
7.使用BP神經(jīng)網(wǎng)絡(luò)搭建手寫數(shù)字識別
8.交叉熵(cross-entropy)講解和使用
9.過擬合,正則化,Dropout
10.各種優(yōu)化器Optimizer
11.改進手寫數(shù)字識別網(wǎng)絡(luò)
12.卷積神經(jīng)網(wǎng)絡(luò)CNN的介紹
13.使用CNN解決手寫數(shù)字識別 |
第二天
下午 |
keras使用 |
1.實現(xiàn)線性回歸
2.實現(xiàn)非線性回歸
3.MNIST數(shù)據(jù)集以及Softmax介紹
4.MNIST分類程序
5.交叉熵的應(yīng)用
6.Dropout應(yīng)用
7.正則化應(yīng)用
8.優(yōu)化器介紹及應(yīng)用
9.CNN應(yīng)用于手寫數(shù)字識別
10.cifar-10圖片分類
11.模型的保存和載入
12.繪制網(wǎng)絡(luò)結(jié)構(gòu) |
第三天
上午 |
圖像識別項目 |
1.介紹Google圖像識別模型Inception-v3
2.使用Inception-v3做圖像識別 |
貓狗分類項目 |
1.圖像數(shù)據(jù)預(yù)處理
2.貓狗分類-簡單CNN
3.貓狗分類-VGG16-bottleneck
4.貓狗分類-VGG16-Finetune |
驗證碼識別項目 |
1.多任務(wù)學習介紹
2.驗證碼識別項目 |
第三天
下午 |
目標檢測項目 |
1.目標檢測任務(wù)介紹
2.RCNN/Fast-RCNN/Faster-RCNN算法介紹
3.YOLO算法介紹
4.SSD算法介紹
5.目標檢測項目實戰(zhàn) |
目標分割項目 |
1.目標分割任務(wù)介紹
2.全卷積網(wǎng)絡(luò)
3.雙線性上采樣
4.特征金字塔
5.Mask RCNN算法介紹
6.目標分割項目實戰(zhàn) |
圖像風格遷移項目 |
1.圖像風格遷移介紹
2.圖像風格遷移項目實戰(zhàn) |
GAN項目 |
1.生成式對抗網(wǎng)絡(luò)GAN介紹
2.生成式對抗網(wǎng)絡(luò)GAN項目實戰(zhàn) |
(注:大綱還可根據(jù)需求進行調(diào)整)
覃棅豐
創(chuàng)業(yè)公司技術(shù)負責人。機器學習,深度學習領(lǐng)域多年一線開發(fā)研究經(jīng)驗,精通算法原理與編程實踐。曾使用Tensorflow,Caffe,Keras等深度學習框架完成過多項圖像,語音,nlp,搜索相關(guān)的人工智能實際項目,研發(fā)經(jīng)驗豐富。擁有兩項國家專利,同時具有多年授課培訓經(jīng)驗,講課通熟易懂,代碼風格簡潔清晰。
人工智能相關(guān)工作經(jīng)歷:
上海希格斯網(wǎng)絡(luò)科技有限公司 數(shù)據(jù)挖掘工程師
1.負責深度學習NLP算法的研究和實現(xiàn)。
2.負責搜索引擎的實現(xiàn)和優(yōu)化。
上海索洛信息技術(shù)有限公司 高級算法工程師
1.負責深度學習圖像算法的研究和實現(xiàn)。
2.負責深度學習語音算法的研究和實現(xiàn)。
人工智能相關(guān)項目經(jīng)驗:
人崗匹配項目 負責算法實現(xiàn)
● 收集了10萬份JD。
● 基于Tensorflow平臺使用LSTM+Attention算法。
● 使用JD訓練職位推薦模型。訓練好的模型可用于分析簡歷描述,并根據(jù)簡歷描述推薦一個或多個適合的職位。
項目關(guān)鍵詞提取項目 負責算法實現(xiàn)
● 收集了10萬份項目描述,并標記好項目中的關(guān)鍵詞。
● 基于Tensorflow平臺使用seq2seq模型。
● 從簡歷的項目描述中提取出該項目中的重點詞匯??捎糜趦?yōu)化簡歷項目搜索結(jié)果。
人才搜索引擎項目 負責搜索引擎的實現(xiàn)和優(yōu)化
● 搭建簡歷搜索引擎服務(wù)。
● 完成學校名,專業(yè),公司,行業(yè)等模塊的搜索策略
● 完成搜索結(jié)果高亮服務(wù)。
● 修改搜索bug優(yōu)化搜索算法。
寵物臉識別項目 負責數(shù)據(jù)處理,算法實現(xiàn)
● 收集了5萬張狗/貓的照片,并標記好它們臉部的區(qū)域。
● 在Linux下基于Caffe平臺使用Faster-rcnn實現(xiàn)狗/貓臉檢測算法。
● 推出了一款在線小游戲,用戶上傳自己家狗/貓的照片,服務(wù)器接收到照片之后用訓練好的模型檢測照片中狗/貓的臉,并把狗/貓的臉框出來,給它們的長相打一上個分數(shù),再把處理后的照片反饋給用戶。
寵物品種識別項目 負責數(shù)據(jù)處理,算法實現(xiàn)
● 收集了19種貓和27種狗的照片,共3萬多張,并做好分類標簽。
● 基于Caffe平臺使用AlexNet,GoogleNet以及自己設(shè)計的網(wǎng)絡(luò)實現(xiàn)寵物品種分類算法。
● 推出了一款在線小游戲,用戶上傳自己家狗/貓的照片,服務(wù)器接收到照片之后用訓練好的模型檢測照片中狗/貓的品種,不同寵物的品種會對應(yīng)不同明星的臉,再把與寵物品種相似的明星臉反饋給用戶。
寵物叫聲情感分類項目 負責數(shù)據(jù)處理,算法實現(xiàn)
● 收集了1萬6千條狗叫聲,分成8個類別。
● 基于Tensorflow平臺使用CNN,LSTM實現(xiàn)狗叫聲情感分類算法。
● 將訓練好的模型放到嵌入式設(shè)備中,實時判斷當前場景是否有狗叫聲,有狗叫聲的話是屬于什么分類。