培訓(xùn)搜索引擎

數(shù)據(jù)分析培訓(xùn)班

內(nèi)訓(xùn)講師:劉暉 需要此內(nèi)訓(xùn)課程請聯(lián)系中華企管培訓(xùn)網(wǎng)
數(shù)據(jù)分析培訓(xùn)班內(nèi)訓(xùn)基本信息:
劉暉
劉暉
(擅長:其他課程 )

內(nèi)訓(xùn)時(shí)長:18天

邀請劉暉 給劉暉留言

內(nèi)訓(xùn)咨詢熱線:010-68630945; 88682348

內(nèi)訓(xùn)課程大綱

數(shù)據(jù)分析培訓(xùn)班(6門課程,共18天)

(1)培訓(xùn)背景

隨著互聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能等科技的快速發(fā)展,經(jīng)濟(jì)發(fā)展已經(jīng)進(jìn)入全球化時(shí)代,企業(yè)的命運(yùn)與國際經(jīng)濟(jì)環(huán)境緊密聯(lián)系,如美國的經(jīng)濟(jì)危機(jī)會波及到全球各個(gè)國家與地區(qū)和企業(yè),國家和企業(yè)已經(jīng)不是孤立的存在。在經(jīng)濟(jì)全球化時(shí)代商業(yè)環(huán)境極其復(fù)雜,不僅要考慮國內(nèi)、國外經(jīng)濟(jì)環(huán)境,同時(shí)還要考慮不同國家的國家政策,不同民族的民族文化,不同宗教的宗教信仰等,更加加深入了商業(yè)環(huán)境的復(fù)雜程度。在極其復(fù)雜的國際商業(yè)環(huán)境中,作為大型企業(yè)領(lǐng)導(dǎo)者僅憑經(jīng)驗(yàn)與智慧無法全面了解與掌控企業(yè)、了解國際化的商業(yè)環(huán)境,因此很難做出正確的企業(yè)戰(zhàn)略決策,甚至更無法做到企業(yè)精細(xì)化管理,更不可能做到高效運(yùn)營,那么,如何突破因商業(yè)環(huán)境復(fù)雜度而導(dǎo)致的企業(yè)失控呢?并在復(fù)雜的商業(yè)競爭環(huán)境中脫穎而出并獲得最大利潤呢?答案是掌握企業(yè)數(shù)據(jù)和掌握國際化數(shù)據(jù),并建立高效的數(shù)據(jù)分析體系,探索數(shù)據(jù)、挖掘數(shù)據(jù)高效準(zhǔn)確的獲取國際化的經(jīng)濟(jì)環(huán)境狀況,洞察市場趨勢提前做出有利于企業(yè)的戰(zhàn)略決策,提高企業(yè)競爭力,規(guī)避市場風(fēng)險(xiǎn),數(shù)據(jù)分析則是提升企業(yè)管理水平,實(shí)現(xiàn)上述目標(biāo)的一種行之有效的方法。國際化的競爭就是信息的國際化競爭。
隨著大數(shù)據(jù)、人工智能的快速發(fā)展,數(shù)據(jù)的價(jià)值越發(fā)突顯,并為海量的高并發(fā)的數(shù)據(jù)分析提供了新的工具與可行性,較以往的傳統(tǒng)數(shù)據(jù)分析工具更為有效,甚至傳統(tǒng)數(shù)據(jù)分析工具做不到的,大數(shù)據(jù)、人工智能都能做到。因此不僅僅企業(yè),社會各個(gè)方面也因大數(shù)據(jù)的價(jià)值而提高了對數(shù)據(jù)的關(guān)注程度,也加大了數(shù)據(jù)分析的投入力度。無論是企業(yè)管理、戰(zhàn)略決策、精準(zhǔn)營銷、精細(xì)化管理等都無處不體現(xiàn)著數(shù)據(jù)分析的重要性。
數(shù)據(jù)如此重要,如何建設(shè)一個(gè)高效的數(shù)據(jù)分析體系呢?至少要具備以下兩個(gè)條件:一是在宏觀層面上正確理解數(shù)據(jù)分析;二是豐富的IT系統(tǒng)建設(shè)經(jīng)驗(yàn)、分布式技術(shù)和較強(qiáng)的數(shù)據(jù)技術(shù)能力。第一點(diǎn)尤為重要,因?yàn)橐坏┰谒枷牒驼J(rèn)識層面對數(shù)據(jù)分析體系理解有誤,那么即使精通于各種技術(shù)方案,所建立起來的也只是一堆技術(shù)架構(gòu)的粗糙堆砌,雖然也能達(dá)到部分?jǐn)?shù)據(jù)分析的效果,但必定會事倍功半。

(2)培訓(xùn)目標(biāo)

本次數(shù)據(jù)分析技術(shù)培訓(xùn)課程,整個(gè)課程體系設(shè)計(jì)完備,思路清晰,學(xué)員通過本次課程的系統(tǒng)性學(xué)習(xí)可以掌握如下技能:
1)    了解數(shù)據(jù)分析的基礎(chǔ)知識及基本理論;
2)    結(jié)合Python語言學(xué)會數(shù)據(jù)的產(chǎn)生、導(dǎo)入與預(yù)處理。掌握大數(shù)據(jù)生成與導(dǎo)入,數(shù)據(jù)分析流程與建模思想,數(shù)據(jù)清洗與數(shù)據(jù)加工等內(nèi)容;
3)    結(jié)合Python語言掌握數(shù)據(jù)分析與挖掘基礎(chǔ)。學(xué)習(xí)常見數(shù)據(jù)分析方法與數(shù)據(jù)挖掘概述,描述型數(shù)據(jù)分析。
4)    學(xué)習(xí)數(shù)據(jù)分析工具Python語言的數(shù)據(jù)分析實(shí)戰(zhàn)。
5)    掌握結(jié)構(gòu)化數(shù)據(jù)工具SQL的應(yīng)用及相關(guān)知識。
6)    學(xué)習(xí)大數(shù)據(jù)可視化技術(shù)。包括數(shù)據(jù)可視化技術(shù)概述及培訓(xùn)關(guān)鍵點(diǎn)概述,數(shù)據(jù)挖掘與可視化工具介紹(Excel、SPSS、Tableau等),可視化案例分享等內(nèi)容。
7)    學(xué)習(xí)Python與數(shù)據(jù)分析實(shí)戰(zhàn)。包括Python語言入門,Python網(wǎng)絡(luò)編程、爬蟲與機(jī)器學(xué)習(xí),Python數(shù)據(jù)分析案例分享等內(nèi)容。

(3)教學(xué)計(jì)劃

本系列課程總共由6門課程組成:
教學(xué)設(shè)計(jì) NO. 課程名稱 課程天數(shù)
基礎(chǔ)理論 1 概率論與數(shù)理統(tǒng)計(jì) 1天
SQL語法基礎(chǔ)及進(jìn)階 2 數(shù)據(jù)分析與挖掘基礎(chǔ) 2天
Python入門 3 Python環(huán)境準(zhǔn)備及相關(guān)數(shù)據(jù)分析庫(pandas、numpy、matplotlib、scipy)的安裝及應(yīng)用 2天
4 Python語言基礎(chǔ)知識 1天
5 正則表達(dá)式及Python編程 1天
Python與數(shù)據(jù)分析實(shí)戰(zhàn) 6 數(shù)據(jù)采集 1天
7 數(shù)據(jù)分析 4天
8 爬蟲技術(shù)與實(shí)踐 4天
數(shù)據(jù)可視化 9 大數(shù)據(jù)可視化 2天
 
 

(4)具體課程方案(含課程大綱)

課程1:概率論與數(shù)理統(tǒng)計(jì)-1天

【匹配關(guān)鍵知識點(diǎn)】
課程目標(biāo)1:建立必要的概率論與數(shù)理統(tǒng)計(jì)基本知識素養(yǎng),掌握探索隨機(jī)現(xiàn)象統(tǒng)計(jì)規(guī)律的一般方法。
課程目標(biāo)2:掌握概率論與數(shù)理統(tǒng)計(jì)的基本概念、基本理論、基本方法和運(yùn)算技能。包括概率論的基本概念、隨機(jī)變量、多維隨機(jī)變量、隨機(jī)變量的數(shù)字特征、數(shù)理統(tǒng)計(jì)的基本概念、參數(shù)估計(jì)等相關(guān)知識。熟悉數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)推斷的各種基本方法。
課程目標(biāo)3:掌握處理隨機(jī)現(xiàn)象的基本思想和方法,培養(yǎng)抽象概括、推理論證、嚴(yán)密的邏輯思維能力,以及使用概率論與數(shù)理統(tǒng)計(jì)的方法去分析和解決有關(guān)實(shí)際問題的能力。
【課程時(shí)間】
1天(8小時(shí)/天)
【課程簡介】
通過本課程的學(xué)習(xí),應(yīng)掌握概率論與數(shù)理統(tǒng)計(jì)的基本概念,了解它的基本理論和方法,從而使學(xué)生初步掌握處理隨機(jī)現(xiàn)象的基本思想和方法,培養(yǎng)學(xué)生運(yùn)用概率統(tǒng)計(jì)方法分析和解決實(shí)際問題的能力,并且在知識傳授的同時(shí)起到價(jià)值引領(lǐng)的作用,積極培育和踐行社會主義核心價(jià)值觀,培養(yǎng)學(xué)生科學(xué)、嚴(yán)謹(jǐn)?shù)乃季S能力。
 
【課程特點(diǎn)】
教學(xué)中以課堂講授為主,以討論為輔。采用啟發(fā)式教學(xué)法,適當(dāng)運(yùn)用討論式教學(xué)法。融入聯(lián)系應(yīng)用的案例式教學(xué)法,并倡導(dǎo)利用結(jié)合軟件技術(shù)解決實(shí)際問題的實(shí)驗(yàn)式教學(xué)法。恰當(dāng)使用多媒體教學(xué)與傳統(tǒng)教學(xué)相結(jié)合的教學(xué)手段,充分運(yùn)用教師對學(xué)生講授與學(xué)生間自由討論相結(jié)合、傳統(tǒng)解題訓(xùn)練與開放型問題探索相結(jié)合、以及實(shí)體課堂面對面交流與虛擬課堂數(shù)字信息交流相結(jié)合的交互式教學(xué)手段,合理利用網(wǎng)絡(luò)資源實(shí)施開放性教學(xué)手段,采用規(guī)范統(tǒng)考與多樣化考查相結(jié)合的考核手段。
【課程大綱】(1天*8小時(shí))
時(shí)間 內(nèi)容 案例實(shí)踐與練習(xí)
Day1
數(shù)據(jù)分析概述
1面向小白的統(tǒng)計(jì)學(xué):描述性統(tǒng)計(jì)(均值,中位數(shù),眾數(shù),方差,標(biāo)準(zhǔn)差,與常見的統(tǒng)計(jì)圖表)
2概率的基本概念(方差、分位數(shù)、隨機(jī)試驗(yàn)、樣本空間、事件、頻率、概率、排列組合),古典概型
3條件概率與貝葉斯公式,獨(dú)立性
4微積分:隨機(jī)變量及其分布(二項(xiàng)分布,均勻分布,正態(tài)分布)
5多維隨機(jī)變量及其分布
6隨機(jī)變量的期望,方差與協(xié)方差
7大數(shù)定律、中心極限定理與抽樣分布
8從抽樣推測規(guī)律之一:點(diǎn)估計(jì)與區(qū)間估計(jì)
9從抽樣推測規(guī)律之二:參數(shù)估計(jì)
10基于正態(tài)總體的假設(shè)檢驗(yàn)
11秩和檢驗(yàn)
12預(yù)測未來的技術(shù):回歸分析
13時(shí)間序列分析
 
案例練習(xí):
 
研討:
 

課程3:數(shù)據(jù)分析與挖掘基礎(chǔ)-6天

【匹配關(guān)鍵知識點(diǎn)】
常見數(shù)據(jù)分析方法與數(shù)據(jù)挖掘概述,描述型數(shù)據(jù)分析,常見數(shù)據(jù)分析與挖掘算法(Kmeans、購物籃、決策樹、樸素貝葉斯等)等內(nèi)容。
【課程時(shí)間】
6天(8小時(shí)/天)
【課程簡介】
隨著大數(shù)據(jù)時(shí)代的快速到來,以及大數(shù)據(jù)在生產(chǎn)生活中迅速應(yīng)用,數(shù)據(jù)分析、數(shù)據(jù)建模、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、人工智能等重要性越發(fā)突出,本課程是針對大數(shù)據(jù)時(shí)代的特點(diǎn),尹老師總結(jié)多年數(shù)據(jù)分析經(jīng)驗(yàn),而精心設(shè)計(jì)的課程,課程內(nèi)容涵蓋了數(shù)據(jù)領(lǐng)域的數(shù)據(jù)處理、統(tǒng)計(jì)分析、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、人工智能等內(nèi)容,以及人工智能的應(yīng)用范圍、發(fā)展前景剖析。
【課程收益】
1、常見數(shù)據(jù)分析方法與數(shù)據(jù)挖掘概述;
2、描述型數(shù)據(jù)分析;
3、常見數(shù)據(jù)分析與挖掘算法(Kmeans、購物籃、決策樹、樸素貝葉斯等)等。
【課程特點(diǎn)】
常見數(shù)據(jù)分析方法與數(shù)據(jù)挖掘概述,描述型數(shù)據(jù)分析,常見數(shù)據(jù)分析與挖掘算法(Kmeans、購物籃、決策樹、樸素貝葉斯等)等內(nèi)容。
【課程對象】
     數(shù)據(jù)分析師、技術(shù)經(jīng)理、產(chǎn)品經(jīng)理、產(chǎn)品助理等
     將承擔(dān)數(shù)據(jù)分析師職責(zé)的業(yè)務(wù)人員或信息化人員
     希望加強(qiáng)數(shù)據(jù)分析能力的軟件開發(fā)人員
     系統(tǒng)集成企業(yè)售前工程師、售前顧問及方案制作人員
【學(xué)員基礎(chǔ)】
     具有2年以IT部門工作經(jīng)驗(yàn),將負(fù)責(zé)數(shù)據(jù)分析等相關(guān)任務(wù)的技術(shù)人員
【課程大綱】(6天*8小時(shí))
時(shí)間 內(nèi)容 案例實(shí)踐與練習(xí)
Day1
常見數(shù)據(jù)分析方法與數(shù)據(jù)挖掘概述
1、 數(shù)據(jù)分析與建模的概念
2、 數(shù)據(jù)分析與建模過程
3、 數(shù)據(jù)分析模型開發(fā)過程
4、 數(shù)據(jù)建模概述
5、 機(jī)器學(xué)習(xí)概念
6、 機(jī)器學(xué)習(xí)算法剖析
7、 算法庫分類
8、 算法庫
9、 深度學(xué)習(xí)
10、 神經(jīng)網(wǎng)絡(luò)
11、 人工智能
12、 商業(yè)智能
 
案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。
 
研討:數(shù)據(jù)分析的過程
Day2
描述型數(shù)據(jù)分析
1、 統(tǒng)計(jì)學(xué)基本概念
2、 統(tǒng)計(jì)數(shù)據(jù)的計(jì)量尺度
3、 常用基本統(tǒng)計(jì)量
4、 集中趨勢的描述指標(biāo)
5、 離散趨勢的描述指標(biāo)
6、 中心極限定理
7、 大數(shù)定律
8、 數(shù)據(jù)的分布
9、 正態(tài)分布的特征
10、 偏度和峰度
11、 檢測數(shù)據(jù)集的分布
12、 數(shù)據(jù)的分布擬合檢驗(yàn)與正態(tài)性檢驗(yàn)
13、 抽樣標(biāo)準(zhǔn)
14、 假設(shè)檢驗(yàn)
15、 T檢驗(yàn)
16、 置信區(qū)間
案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。
 
研討:描述性數(shù)據(jù)分析
Day3
常見數(shù)據(jù)分析與挖掘算法
1、 數(shù)據(jù)挖掘的基本任務(wù)
2、 數(shù)據(jù)挖掘建模過程
a)      定義挖掘目標(biāo)
b)     數(shù)據(jù)取樣
c)      數(shù)據(jù)探索
d)     數(shù)據(jù)預(yù)處理
e)     挖掘建模
f)      建立模型
g)     業(yè)務(wù)理解
h)     模型擬合
i)       訓(xùn)練集
j)       測試集
k)      模型評價(jià)
3、 常用的數(shù)學(xué)預(yù)測模型
a)      線性回歸
b)     回歸(預(yù)測)與分類
c)      決策樹與隨機(jī)森林
d)     聚類分析(kmeans)
e)     關(guān)聯(lián)規(guī)則
f)      時(shí)序模式
g)     離群點(diǎn)檢測
h)     深度學(xué)習(xí)
i)       人工智能
j)       神經(jīng)網(wǎng)絡(luò)
4、 案例:如何從數(shù)據(jù)中挖掘出有價(jià)值的信息
案例研討:通過案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。
 
研討:常用數(shù)據(jù)分析方法與算法
Day4
樸素貝葉斯與回歸分析
第1個(gè)主題: 主成分分析和因子分析(深入剖析主成分分析及因子分析)
1、 主成分分析
2、 總體主成分
3、 樣本主成分
4、 主成分分析模型
5、 案例:主成分分析模型實(shí)現(xiàn)
6、 課堂實(shí)操:主成分分析模型實(shí)現(xiàn)
 
第2個(gè)主題: 方差分析(深入剖析方差分析方法及實(shí)現(xiàn))
1、 單因素方差分析
2、 單因素方差分析模型
3、 因素效應(yīng)的顯著性檢驗(yàn)
4、 因素各水平均值的估計(jì)與比較
5、 兩因素等重復(fù)試驗(yàn)下的方差分析
6、 統(tǒng)計(jì)模型
7、 交互效應(yīng)及因素效應(yīng)的顯著性檢驗(yàn)
8、 無交互效應(yīng)時(shí)各因素均值的估計(jì)與比較
9、 有交互效應(yīng)時(shí)因素各水平組合上的均值估計(jì)與比較
10、 兩因素非重復(fù)試驗(yàn)下的方差分析
11、 金融案例:方差分析實(shí)現(xiàn)
12、 課堂實(shí)操:方差分析實(shí)現(xiàn)
第3個(gè)主題: Bayes統(tǒng)計(jì)分析(深入剖析Bayes統(tǒng)計(jì)分析)
1、 Baves統(tǒng)計(jì)模型
2、 Bayes統(tǒng)計(jì)分析的基本思想
3、 Bayes統(tǒng)計(jì)模型
4、 Bayes統(tǒng)計(jì)推斷原則
5、 先驗(yàn)分布的Bayes假設(shè)與不變先驗(yàn)分布
6、 共軛先驗(yàn)分布
7、 先驗(yàn)分布中超參數(shù)的確定
8、 Baves統(tǒng)計(jì)推斷
9、 參數(shù)的Bayes點(diǎn)估計(jì)
10、 Bayes區(qū)間估計(jì)
11、 Bayes假設(shè)檢驗(yàn)
12、 案例:實(shí)現(xiàn)Bayes統(tǒng)計(jì)分析建模
13、 課堂實(shí)操:實(shí)現(xiàn)Bayes統(tǒng)計(jì)分析建模
 
第4個(gè)主題: 數(shù)學(xué)建模(深入剖析數(shù)學(xué)建模)
1、 數(shù)學(xué)建模
2、 數(shù)學(xué)預(yù)測模型
3、 模型評估
4、 模型參數(shù)優(yōu)化
 
第5個(gè)主題: 回歸分析與分類分析原理與應(yīng)用(深入剖析數(shù)據(jù)的回歸分析與分類分析的原理以及應(yīng)用)
1、 回歸與分類
2、 回歸分析概念
3、 線性回歸模型及其參數(shù)估計(jì)
4、 一元線性回歸
5、 一元線性回歸模型
6、 一元線性回歸模型求解參數(shù)
7、 損失函數(shù)
8、 求偏導(dǎo)
9、 回歸方程的顯著性檢驗(yàn)
10、 殘差分析
11、 誤差項(xiàng)的正態(tài)性檢驗(yàn)
12、 殘差圖分析
13、 統(tǒng)計(jì)推斷與預(yù)測
14、 回歸模型的選取
15、 窮舉法
16、 逐步回歸法
17、 嶺回歸分析
18、 一元線性回歸
19、 金融案例:一元線性回歸模型檢驗(yàn)
20、 多元線性回歸概述
21、 多元線性回歸模型
22、 金融案例:多元線性回歸實(shí)現(xiàn)航空業(yè)信用打分和評級模型
 
第6個(gè)主題: Logistic回歸分析(剖析Logistic回歸與其它回歸分析方法)
1、 Logistic回歸介紹
2、 Logistic函數(shù)
3、 Logistic回歸模型
4、 案例:SPSS Logistic回歸實(shí)現(xiàn)
5、 課堂實(shí)操: Logistic回歸實(shí)現(xiàn)航空業(yè)欺詐預(yù)測模型
6、 課堂實(shí)操: Logistic回歸實(shí)現(xiàn)航空業(yè)風(fēng)險(xiǎn)分析模型
 
第7個(gè)主題: 非線性回歸原理及應(yīng)用(剖析非線性回歸原理及應(yīng)用實(shí)踐)
1、 非線性回歸
2、 雙曲線函數(shù)
3、 冪函數(shù)
4、 指數(shù)函數(shù)
5、 對數(shù)函數(shù)
6、 S型曲線
7、 案例:非線性回歸實(shí)現(xiàn)
8、 課堂實(shí)操:非線性回歸實(shí)現(xiàn)航空業(yè)經(jīng)營分析和績效分析模型
案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。
 
研討:主成分分析模型實(shí)現(xiàn)
Day5
聚類分析與關(guān)聯(lián)規(guī)則挖掘
 
第1個(gè)主題: 數(shù)據(jù)建模常用距離(深入剖析數(shù)據(jù)建模過程中常用的距離模型)
1、 數(shù)據(jù)挖掘常用距離
2、 歐氏距離
3、 曼哈頓距離
4、 切比雪夫距離
5、 閔可夫斯基距離
6、 標(biāo)準(zhǔn)化歐氏距離
7、 馬氏距離
8、 夾角余弦
9、 漢明距離
10、 杰卡德距離& 杰卡德相似系數(shù)
11、 相關(guān)系數(shù)& 相關(guān)距離
12、 信息熵
 
第2個(gè)主題: 聚類分析與建模實(shí)現(xiàn)(深入剖析聚類分析以及通過SPSS聚類算法模型分析數(shù)據(jù))
1、 聚類分析
2、 聚類算法
3、 樣品間相近性的度量
4、 快速聚類法
5、 快速聚類法的步驟
6、 用Lm距離進(jìn)行快速聚類
7、 譜系聚類法
8、 類間距離及其遞推公式
9、 譜系聚類法的步驟
10、 變量聚類
11、 案例:SPSS聚類實(shí)現(xiàn)及繪圖
12、 案例:Kmeans應(yīng)用案例剖析
13、 課堂實(shí)操:編寫程序?qū)崿F(xiàn)Kmeans應(yīng)用案例剖析
 
第3個(gè)主題: 關(guān)聯(lián)規(guī)則分析與實(shí)現(xiàn)(深入剖析關(guān)聯(lián)規(guī)則分析以及通過SPSS關(guān)聯(lián)規(guī)則算法模型分析數(shù)據(jù))
1、 關(guān)聯(lián)規(guī)則
2、 支持度與置信度
3、 關(guān)聯(lián)規(guī)則挖掘的過程
4、 Apriori算法
5、 關(guān)聯(lián)規(guī)則案例
6、 支持度與置信度計(jì)算
7、 案例:SPSS實(shí)現(xiàn)關(guān)聯(lián)規(guī)則
8、 課堂實(shí)操:SPSS實(shí)現(xiàn)航空業(yè)數(shù)據(jù)關(guān)聯(lián)規(guī)則分析
案例練習(xí):通過編寫程序?qū)崿F(xiàn)Kmeans應(yīng)用案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。
 
研討:編寫程序?qū)崿F(xiàn)Kmeans應(yīng)用案例剖析
Day6
決策樹與隨機(jī)森林
 
第1個(gè)主題: 決策樹分析與實(shí)現(xiàn)(深入剖析決策樹分析以及通過SPSS決策樹模型分析數(shù)據(jù))
1、 決策樹分析
2、 決策樹
3、 決策樹構(gòu)成要素
4、 決策樹算法原理
5、 決策樹法的決策過程
6、 決策樹算法
7、 案例:實(shí)現(xiàn)決策樹分析
8、 課堂實(shí)操:實(shí)現(xiàn)航空業(yè)客戶細(xì)分模型
9、 隨機(jī)森林
 
 
第2個(gè)主題: 數(shù)據(jù)建模時(shí)序模式分析與實(shí)現(xiàn)(深入剖析時(shí)序模式分析)
1、 時(shí)序模式
2、 時(shí)間序列分析
3、 時(shí)間序列分析
4、 時(shí)間序列
5、 序列分析的三個(gè)階段
6、 課堂實(shí)操:實(shí)現(xiàn)航空業(yè)客戶流失模型
案例練習(xí):通過實(shí)現(xiàn)航空業(yè)客戶細(xì)分模型案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。
 
研討:實(shí)現(xiàn)航空業(yè)客戶細(xì)分模型
 

課程8:大數(shù)據(jù)可視化-2天

【匹配關(guān)鍵知識點(diǎn)】
數(shù)據(jù)可視化技術(shù)概述及培訓(xùn)關(guān)鍵點(diǎn)概述,數(shù)據(jù)挖掘與可視化工具介紹(SAS、Project、Excel、SPSS、Tableau等),可視化案例分享等內(nèi)容。
【課程時(shí)間】
2天(8小時(shí)/天)
【課程簡介】
隨著互聯(lián)網(wǎng)、移動(dòng)智能設(shè)備、云計(jì)算技術(shù)、大數(shù)據(jù)技術(shù)的迅猛發(fā)展,使人類產(chǎn)生與獲取數(shù)據(jù)的能力成數(shù)量級地增加,面對如此浩瀚的數(shù)據(jù)海洋,想通過人工分析大數(shù)據(jù)從而得到大數(shù)據(jù)中隱含的有價(jià)值的模式,幾乎是不可能的。因此人們需要借助新的技術(shù)挖掘大數(shù)據(jù)中所蘊(yùn)含的價(jià)值,采用數(shù)據(jù)可視化技術(shù)絕對是一個(gè)明智的選擇。
隨著科學(xué)技術(shù)的不斷發(fā)展,大量的由計(jì)算機(jī)產(chǎn)生的中間數(shù)據(jù)都需要進(jìn)行可視化處理,以求達(dá)到輔助分析、再現(xiàn)客觀事實(shí)的目的。通過視覺化呈現(xiàn)數(shù)據(jù),可揭示了令人驚奇的模式和觀察結(jié)果,某些數(shù)據(jù)是不可能通過簡單統(tǒng)計(jì)就能顯而易見的看到的模式和結(jié)論。正如作家、記者和信息設(shè)計(jì)師David McCandless 在TED 上說道:“通過視覺化,我們把信息變成了一道可用眼睛來探索的風(fēng)景線,一種信息地圖。當(dāng)你在迷失在信息中時(shí),信息地圖非常實(shí)用”。由此足見數(shù)據(jù)可視化的價(jià)值。
無論獲得信息還是表達(dá)信息,最佳方式之一是通過視覺化方式,快速捕捉和展現(xiàn)信息要點(diǎn)與核心要義,這是數(shù)據(jù)可視化的價(jià)值點(diǎn)所在。
數(shù)據(jù)可視化技術(shù)有著廣闊的發(fā)展和應(yīng)用空間,越來越受到人們的關(guān)注。
【課程收益】
1、數(shù)據(jù)可視化技術(shù)概述及培訓(xùn)關(guān)鍵點(diǎn)概述;
2、數(shù)據(jù)挖掘與可視化工具介紹;
3、可視化案例分享
【課程特點(diǎn)】
數(shù)據(jù)可視化技術(shù)概述及培訓(xùn)關(guān)鍵點(diǎn)概述,數(shù)據(jù)挖掘與可視化工具介紹(SAS、Project、Excel、SPSS、Tableau等),可視化案例分享等內(nèi)容。
【課程對象】
     數(shù)據(jù)分析師、技術(shù)經(jīng)理、產(chǎn)品經(jīng)理、產(chǎn)品助理等
     將承擔(dān)數(shù)據(jù)分析師職責(zé)的業(yè)務(wù)人員或信息化人員
     希望加強(qiáng)數(shù)據(jù)分析能力的軟件開發(fā)人員
     系統(tǒng)集成企業(yè)售前工程師、售前顧問及方案制作人員
【學(xué)員基礎(chǔ)】
     具有2年以IT部門工作經(jīng)驗(yàn),將負(fù)責(zé)數(shù)據(jù)分析等相關(guān)任務(wù)的技術(shù)人員
【課程大綱】(2天*8小時(shí))
時(shí)間 內(nèi)容 案例實(shí)踐與練習(xí)
Day1
數(shù)據(jù)可視化技術(shù)概述及培訓(xùn)關(guān)鍵點(diǎn)概述
 
第1個(gè)主題: 數(shù)據(jù)可視化問題剖析(深入大數(shù)據(jù)時(shí)代數(shù)據(jù)可視化存在的問題)
1、 大數(shù)據(jù)特征vs數(shù)據(jù)可視化
2、 傳統(tǒng)數(shù)據(jù)可視化問題剖析
3、 傳統(tǒng)數(shù)據(jù)可視化工具特點(diǎn)剖析
 
第2個(gè)主題: 數(shù)據(jù)可視化概述(介紹數(shù)據(jù)可視化工具、特征及基礎(chǔ)架構(gòu))
1、 數(shù)據(jù)可視化概念
2、 數(shù)據(jù)可視化作用
3、 數(shù)據(jù)可視化目標(biāo)
4、 數(shù)據(jù)可視化應(yīng)用
5、 數(shù)據(jù)維度和指標(biāo)
6、 圖表產(chǎn)生過程
7、 可視化的表現(xiàn)形式
8、 可視化的顯示
9、 可視化的色彩
10、 可視化案例實(shí)戰(zhàn):儀表盤制作
11、 標(biāo)準(zhǔn)圖表的表現(xiàn)能力
12、 標(biāo)準(zhǔn)圖表的選擇標(biāo)準(zhǔn)
13、 圖表制作原則
14、 可視化案例實(shí)戰(zhàn):數(shù)據(jù)占比柏拉圖繪制
15、 可視化的決定性因素
16、 數(shù)據(jù)可視化技巧
17、 數(shù)據(jù)化可視化工具
18、 創(chuàng)意性數(shù)據(jù)可視化
19、 虛擬實(shí)現(xiàn)技術(shù)
20、 防止過度可視化
21、 一圖勝千言
22、 可視化的升華:聲音
 
第3個(gè)主題: 可視化的探索性分析和數(shù)據(jù)挖掘工具(學(xué)習(xí)可視化數(shù)據(jù)挖掘工具)
1、 Tableau
2、 Excel
3、 ECharts
4、 QlikView
5、 R語言
6、 Python
7、 SPSS
8、 SAS
 
第4個(gè)主題: 數(shù)據(jù)可視化圖表詳解(通過實(shí)例講述數(shù)據(jù)可視化方法、過程及含義)
1、 散點(diǎn)圖
2、 雷達(dá)圖
3、 條形圖
4、 柱形圖
5、 餅圖
6、 直方圖
7、 箱線圖
8、 QQ圖
9、 柏拉圖制作
10、 儀表盤制作
11、 玫瑰圖制作
12、 熱力圖制作
13、 地圖制作
14、 文字云制作
15、 案例剖析
案例練習(xí):通過儀表盤制作案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。
 
研討:儀表盤制作
Day2
數(shù)據(jù)挖掘與可視化工具介紹(SAS、Project、Excel、SPSS、Tableau等),可視化案例分享
 
第1個(gè)主題: Tableau簡介
1、 Tableau歷史與趨勢剖析
2、 Tableau使用
3、 Tableau的數(shù)據(jù)類型介紹
4、 Tableau的數(shù)據(jù)結(jié)構(gòu)介紹
5、 Tableau數(shù)據(jù)的讀入和輸出
6、 Tableau數(shù)據(jù)庫的讀/寫
7、 Tableau與Kylin集成
8、 定性變量
9、 離散變量
10、 連續(xù)變量
11、 多元變量
12、 日期和時(shí)間數(shù)據(jù)的操作處理
 
第2個(gè)主題: 數(shù)據(jù)可視化應(yīng)用場景,具體案例分析
1、 淘寶24小時(shí)生活數(shù)據(jù)可視化案例
2、 無線淘寶數(shù)據(jù)可視化案例
3、 Google公司數(shù)據(jù)可視化案例
4、 Facebook用戶畫像可視化案例
5、 個(gè)人用戶畫像案例
 
第3個(gè)主題: 大數(shù)據(jù)可視化呈現(xiàn)ECharts實(shí)戰(zhàn)(通過一個(gè)完整的實(shí)例講述使用ECharts數(shù)據(jù)可視化的過程與方法)
1、 Echarts使用
2、 項(xiàng)目案例
3、 Echarts概述
4、 ECharts特性
5、 ECharts架構(gòu)圖
6、 整合
7、 How to use?
8、 Step1. 引入模塊加載器
9、 Step2. 設(shè)置具備大小的Dom
10、 Step3. 配置echarts模塊路徑
11、 Step4.動(dòng)態(tài)加載echarts
12、 option的使用
13、 Interface
14、 setOption
15、 Option全局屬性
16、 title
17、 legend
18、 dataRange
19、 toolbox
20、 dataZoom
21、 grid
22、 xAxis/yAxis/axis
23、 color
24、 數(shù)值型
25、 類目型
26、 tooltip.formatter
27、 series
28、 高度個(gè)性化
29、 其它參考圖形
30、 熱力圖
31、 社交網(wǎng)絡(luò)
 
第4個(gè)主題: 分析結(jié)果呈現(xiàn)和分析報(bào)告撰寫
1、 合理的數(shù)據(jù)呈現(xiàn)
2、 報(bào)告分析模板
3、 如何撰寫一份優(yōu)秀的數(shù)據(jù)分析報(bào)告
案例研討:通過淘寶24小時(shí)生活數(shù)據(jù)可視化案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。
 
研討:淘寶24小時(shí)生活數(shù)據(jù)可視化案例
 
 

課程9:Python與數(shù)據(jù)分析實(shí)戰(zhàn)-13天

【匹配關(guān)鍵知識點(diǎn)】
Python語言入門,Python網(wǎng)絡(luò)編程、爬蟲與機(jī)器學(xué)習(xí),Python數(shù)據(jù)分析案例分享,基于spark集群的python數(shù)據(jù)分析實(shí)戰(zhàn)等內(nèi)容。
【課程時(shí)間】
13天(8小時(shí)/天)
【課程簡介】
隨著大數(shù)據(jù)時(shí)代的快速到來,以及大數(shù)據(jù)在生產(chǎn)生活中迅速應(yīng)用,大數(shù)據(jù)領(lǐng)域如雨后春筍般的出現(xiàn)大量的新技術(shù),如Hadoop、Spark等技術(shù),其中Python語言已經(jīng)成為大數(shù)據(jù)技術(shù)中最為重要的一部分,被越來越多的企業(yè)所使用。Python語言的功能涵蓋了大數(shù)據(jù)領(lǐng)域的數(shù)據(jù)處理、統(tǒng)計(jì)分析、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、人工智能、大數(shù)據(jù)應(yīng)用開發(fā)等各種不同類型的計(jì)算操作,應(yīng)用范圍廣泛、前景非常廣闊。本課程是尹老師多年工作經(jīng)驗(yàn)的總結(jié)和歸納,從實(shí)際業(yè)務(wù)案例為入口,使學(xué)員從理論層到實(shí)操層面系統(tǒng)的學(xué)習(xí)數(shù)據(jù)處理技術(shù),使學(xué)員深入理解Python語言等數(shù)據(jù)分析工具。通過本課程的學(xué)習(xí),學(xué)員即可以正確的分析企業(yè)的數(shù)據(jù),為管理者、決策層提供數(shù)據(jù)支撐。
【課程收益】
1、Python語言入門;
2、Python網(wǎng)絡(luò)編程;
3、Python網(wǎng)絡(luò)爬蟲;
4、Python機(jī)器學(xué)習(xí);
5、Python數(shù)據(jù)分析案例分享;
6、基于spark集群的python數(shù)據(jù)分析實(shí)戰(zhàn);
【課程特點(diǎn)】
Python語言入門,Python網(wǎng)絡(luò)編程、爬蟲與機(jī)器學(xué)習(xí),Python數(shù)據(jù)分析案例分享,基于spark集群的python數(shù)據(jù)分析實(shí)戰(zhàn)等內(nèi)容。
【課程對象】
     數(shù)據(jù)分析師、技術(shù)經(jīng)理、產(chǎn)品經(jīng)理、產(chǎn)品助理等
     將承擔(dān)數(shù)據(jù)分析師職責(zé)的業(yè)務(wù)人員或信息化人員
     希望加強(qiáng)數(shù)據(jù)分析能力的軟件開發(fā)人員
     系統(tǒng)集成企業(yè)售前工程師、售前顧問及方案制作人員
【學(xué)員基礎(chǔ)】
     具有2年以IT部門工作經(jīng)驗(yàn),將負(fù)責(zé)數(shù)據(jù)分析等相關(guān)任務(wù)的技術(shù)人員
【課程大綱】(13天*8小時(shí))
時(shí)間 內(nèi)容 案例實(shí)踐與練習(xí)
Day1~Day3
Python語言入門
第1個(gè)主題: Python語言基礎(chǔ)知識(介紹Python語言基礎(chǔ)知識,包括Python語言數(shù)據(jù)類型、基礎(chǔ)概念等)
1、 Python語言歷史與趨勢剖析
2、 Python語言安裝
3、 如何運(yùn)行Python程序
4、 PyCharm開發(fā)環(huán)境介紹
5、 Anaconda3開發(fā)環(huán)境介紹(以Anaconda3作為程序演示環(huán)境,Python3作為演示語言)
6、 Python語言help()命令
7、 Python基本命令
8、 變量(Variables)
9、 表達(dá)式(Expressions)
10、 基本數(shù)據(jù)類型
11、 字符串與正則表達(dá)式
12、 Python條件表達(dá)式
13、 循環(huán)(loops)
14、 案例實(shí)戰(zhàn):正則表達(dá)式在爬蟲中應(yīng)用實(shí)例
15、 Python數(shù)據(jù)結(jié)構(gòu)
16、 Python創(chuàng)建數(shù)組
17、 Python矩陣運(yùn)算
18、 Python語言語法結(jié)構(gòu)
19、 案例:Python語言實(shí)現(xiàn)運(yùn)營商數(shù)據(jù)分析處理
 
第2個(gè)主題: Python函數(shù)(深入Python函數(shù)的編寫語言)
13、 Python函數(shù)介紹
14、 數(shù)據(jù)分析與建模過程
15、 Python語言定義函數(shù)規(guī)則
16、 Python語言自定義函數(shù)
17、 Python匿名函數(shù)
18、 Python內(nèi)置函數(shù)
19、 Python函數(shù)案例
 
第3個(gè)主題: Python類(class)(深入剖析Python類的原理)
1、 類(class)介紹
2、 Python多重繼承
3、 Python不支持函數(shù)重載
4、 Class and Instance Variables
5、 Method Objects
6、 Python類編寫案例實(shí)戰(zhàn)
 
第4個(gè)主題: Python異常處理(Exceptions)(深入剖析Python異常處理)
1、 異常處理(Exceptions)簡介
2、 Python標(biāo)準(zhǔn)異常類
3、 Python異常類編程案例實(shí)戰(zhàn)(爬蟲實(shí)例)
 
第5個(gè)主題: Python模塊(Modules)(深入剖析模塊(Modules))
1、 Python模塊(Modules)介紹
2、 Python自定義模塊
3、 Python模塊的導(dǎo)入與添加
4、 Python標(biāo)準(zhǔn)函數(shù)庫模塊
5、 Python第三方模塊
 
第6個(gè)主題: Python文件讀寫(深入剖析Python文件讀寫)
1、 Python文件讀寫簡介
2、 Python讀寫方法介紹
3、 Python讀寫文本文件
4、 Python讀寫二進(jìn)制文件
5、 Python讀寫json文件
6、 Python讀寫xml文件
 
第7個(gè)主題: Python操作關(guān)系型數(shù)據(jù)庫(深入剖析Python操作關(guān)系型數(shù)據(jù))
1、 Python2安裝MySQL Connector
2、 Python3安裝MySQL Connector
3、 Python語言操作數(shù)據(jù)庫
4、 Python語言數(shù)據(jù)庫優(yōu)化
5、 案例:Python語言實(shí)現(xiàn)話務(wù)數(shù)據(jù)時(shí)間序列建模
案例練習(xí):通過Python語言實(shí)現(xiàn)運(yùn)營商數(shù)據(jù)分析處理案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。
 
研討:Python語言實(shí)現(xiàn)運(yùn)營商數(shù)據(jù)分析處理
Day4~Day5
Python網(wǎng)絡(luò)編程
 
第1個(gè)主題: 多線程編程 (用實(shí)戰(zhàn)實(shí)例介紹如何實(shí)現(xiàn)多線程)
1、 Python開發(fā)多線程的原理
2、 多線程創(chuàng)建
3、 線程鎖
4、 網(wǎng)絡(luò)應(yīng)用程序編程
5、 實(shí)例:比如生成發(fā)送電子郵件
 
 
第2個(gè)主題: Python網(wǎng)絡(luò)編程(介紹Python網(wǎng)絡(luò)編程)
1、 TCP/IP網(wǎng)絡(luò)介紹
2、 Socket基礎(chǔ)知識
3、 Socket客戶端服務(wù)器連接
4、 案例:聊天功能實(shí)戰(zhàn)
 
第3個(gè)主題: Python Web開發(fā)實(shí)戰(zhàn)(介紹Python Web實(shí)戰(zhàn))
1、 Python Web開發(fā)
2、 Django框架介紹
3、 定義和使用模型
4、 Django MVC架構(gòu)
5、 Django開發(fā)環(huán)境搭建
6、 Django Session應(yīng)用
7、 Django框架應(yīng)用
8、 Django高級應(yīng)用
9、 案例:客戶通話歷史記錄查詢
案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。
 
研討:網(wǎng)絡(luò)編程
Day6~Day7
Python網(wǎng)絡(luò)爬蟲
 
第1個(gè)主題: Python基礎(chǔ)知識和網(wǎng)絡(luò)程序基礎(chǔ)知識(介紹Python基礎(chǔ)知識和網(wǎng)絡(luò)程序基礎(chǔ)知識)
1、 Python語言簡介
2、 Python開發(fā)環(huán)境搭建和選擇
3、 IO編程
4、 進(jìn)程和多線程基礎(chǔ)知識
5、 網(wǎng)絡(luò)編程和TCP協(xié)議
 
第2個(gè)主題: Web前端基礎(chǔ)知識(介紹Web前端基礎(chǔ)知識)
1、 Web程序的結(jié)構(gòu)
2、 Web前端的內(nèi)容
3、 HTML
4、 CSS
5、 JavaScript
6、 XPath
7、 Json
8、 HTTP協(xié)議標(biāo)準(zhǔn)
9、 HTTP頭和主體
10、 Cookie信息
 
第3個(gè)主題: 網(wǎng)絡(luò)爬蟲基礎(chǔ)知識(介紹網(wǎng)絡(luò)爬蟲基礎(chǔ)知識)
1、 網(wǎng)絡(luò)爬蟲概述
2、 網(wǎng)絡(luò)爬蟲及其應(yīng)用
3、 網(wǎng)絡(luò)爬蟲結(jié)構(gòu)
4、 HTTP請求的Python實(shí)現(xiàn)
5、 urllib2/urllib實(shí)現(xiàn)
6、 httplib/urllib實(shí)現(xiàn)
7、 更人性化的Requests
 
第4個(gè)主題: HTML解析(HTML解析原理介紹)
1、 初識Firebug
2、 安裝和配置Firebug
3、 正則表達(dá)式
4、 基本語法與使用
5、 Python中使用正則表達(dá)式
6、 BeautifulSoup概述
7、 安裝和配置BeautifulSoup
8、 BeautifulSoup的使用
9、 lxml的XPath解析
 
第5個(gè)主題: 基本的爬蟲程序開發(fā)(介紹基本的爬蟲程序開發(fā))
1、 基礎(chǔ)爬蟲架構(gòu)及運(yùn)行流程
2、 URL管理器
3、 HTML下載器
4、 HTML解析器
5、 數(shù)據(jù)存儲器
6、 爬蟲調(diào)度器
 
第6個(gè)主題: 協(xié)議分析(協(xié)議分析)
1、 Web端協(xié)議分析
2、 網(wǎng)頁登錄POST分析
3、 隱藏表單分析
4、 加密數(shù)據(jù)分析
5、 驗(yàn)證碼問題
6、 IP代理
7、 Cookie登錄
8、 傳統(tǒng)驗(yàn)證碼識別
9、 人工打碼
10、 滑動(dòng)驗(yàn)證碼
11、 PC客戶端抓包分析
12、 HTTPAnalyzer簡介
13、 蝦米音樂PC端API實(shí)戰(zhàn)分析
14、 App抓包分析
15、 Wireshark簡介
16、 酷我聽書App端API實(shí)戰(zhàn)分析
17、 API爬蟲:爬取mp3資源信息
 
第7個(gè)主題: Scrapy爬蟲框架(介紹Scrapy爬蟲框架)
1、 Scrapy爬蟲架構(gòu)
2、 安裝Scrapy
3、 創(chuàng)建cnblogs項(xiàng)目
4、 創(chuàng)建爬蟲模塊
5、 定義Item
6、 翻頁功能
7、 構(gòu)建ItemPipeline
8、 內(nèi)置數(shù)據(jù)存儲
9、 啟動(dòng)爬蟲
10、 強(qiáng)化爬蟲
11、 調(diào)試方法
12、 異常
13、 控制運(yùn)行狀態(tài)
14、 ItemLoader
15、 Item與ItemLoader
16、 輸入與輸出處理器
17、 ItemLoaderContext?
18、 請求與響應(yīng)
19、 下載器中間件
20、 Spider中間件
21、 擴(kuò)展
22、 突破反爬蟲
案例研討:通過案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。
 
研討:網(wǎng)絡(luò)爬蟲的實(shí)現(xiàn)
Day8
Python的NumPy模塊
1、 NumPy 安裝
2、 NumPy Ndarray 對象
3、 NumPy 數(shù)據(jù)類型
4、 NumPy 數(shù)組屬性
5、 NumPy 創(chuàng)建數(shù)組
6、 NumPy 從已有的數(shù)組創(chuàng)建數(shù)組
7、 NumPy 從數(shù)值范圍創(chuàng)建數(shù)組
8、 NumPy 切片和索引
9、 NumPy 高級索引
10、 NumPy 廣播(Broadcast)
11、 NumPy 迭代數(shù)組
12、 Numpy 數(shù)組操作
13、 NumPy 位運(yùn)算
14、 NumPy 字符串函數(shù)
15、 NumPy 數(shù)學(xué)函數(shù)
16、 NumPy 算術(shù)函數(shù)
17、 NumPy 統(tǒng)計(jì)函數(shù)
18、 NumPy 排序、條件刷選函數(shù)
19、 NumPy 字節(jié)交換
20、 NumPy 副本和視圖
21、 NumPy 矩陣庫(Matrix)
22、 NumPy 線性代數(shù)
23、 NumPy IO
24、 NumPy Matplotlib
案例練習(xí):通過NumPy的案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。
 
研討:NumPy的數(shù)據(jù)處理
Day9
Python的Pandas模塊
1、 Pandas環(huán)境安裝配置
2、 Pandas數(shù)據(jù)結(jié)構(gòu)
3、 Pandas快速入門
4、 Pandas系列
5、 Pandas數(shù)據(jù)幀(DataFrame)
6、 Pandas面板(Panel)
7、 Pandas基本功能
8、 Pandas描述性統(tǒng)計(jì)
9、 Pandas函數(shù)應(yīng)用
10、 Pandas重建索引
11、 Pandas迭代
12、 Pandas排序
13、 Pandas字符串和文本數(shù)據(jù)
14、 Pandas選項(xiàng)和自定義
15、 Pandas索引和選擇數(shù)據(jù)
16、 Pandas統(tǒng)計(jì)函數(shù)
17、 Pandas窗口函數(shù)
18、 Pandas聚合
19、 Pandas缺失數(shù)據(jù)
20、 Pandas分組(GroupBy)
21、 Pandas合并/連接
22、 Pandas級聯(lián)
23、 Pandas日期功能
24、 Pandas時(shí)間差(Timedelta)
25、 Pandas分類數(shù)據(jù)
26、 Pandas可視化
27、 Pandas IO工具
28、 Pandas稀疏數(shù)據(jù)
29、 Pandas注意事項(xiàng)&竅門
30、 Pandas與SQL比較
案例練習(xí):通過Pandas使用案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。
 
研討:Pandas的使用方法
Day10
Python機(jī)器學(xué)習(xí)
第1個(gè)主題: Python平臺下的機(jī)器學(xué)習(xí)開發(fā)技術(shù)(介紹Python平臺下的機(jī)器學(xué)習(xí)開發(fā)技術(shù))
31、 Python平臺下的數(shù)據(jù)分析工具
32、 Python平臺下的數(shù)據(jù)分析工具概述
33、 NumPy數(shù)據(jù)處理
34、 NumPy案例
35、 Scipy數(shù)值計(jì)算
36、 SymPy符號處理
37、 Matplotlib繪制圖表
38、 Pandas數(shù)據(jù)分析、探索工具
39、 Pandas的DataFrame
40、 DataFrame的構(gòu)造
41、 StatsModels數(shù)據(jù)統(tǒng)計(jì)建模分析
42、 Scikit-Learn機(jī)器學(xué)習(xí)庫
43、 Keras人工神經(jīng)網(wǎng)絡(luò)
44、 Keras的設(shè)計(jì)原則
45、 Gensim文本挖掘庫
46、 OpenCV計(jì)算機(jī)視覺庫
47、 案例:Python語言實(shí)現(xiàn)基于聚類的圖像分割方法
案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。
 
研討:Python語言實(shí)現(xiàn)基于聚類的圖像分割方法
Day11
Python機(jī)器學(xué)習(xí)
 
第1個(gè)主題: 聚類模型原理與實(shí)現(xiàn)(深入剖析聚類原理以及通過Python語言實(shí)現(xiàn)聚類算法模型)
1、 聚類介紹
2、 聚類算法應(yīng)用場景
3、 聚類算法應(yīng)用案例
4、 樣品間相近性的度量
5、 快速聚類法
6、 快速聚類法的步驟
7、 用Lm距離進(jìn)行快速聚類
8、 譜系聚類法
9、 類間距離及其遞推公式
10、 譜系聚類法的步驟
11、 變量聚類
12、 K-Means(K均值)聚類
13、 均值漂移聚類
14、 基于密度的聚類方法(DBSCAN)
15、 用高斯混合模型(GMM)的最大期望(EM)聚類
16、 凝聚層次聚類
17、 圖團(tuán)體檢測(Graph Community Detection)
18、 案例:Python語言聚類實(shí)現(xiàn)及繪圖
19、 案例:Kmeans應(yīng)用案例剖析
20、 課堂實(shí)操:Python語言實(shí)現(xiàn)基于聚類的圖像分割方法
 
第2個(gè)主題: 決策樹模型原理與實(shí)現(xiàn)(深入剖析決策樹原理以及通過Python語言實(shí)現(xiàn)決策樹模型)
1、 決策樹介紹
2、 決策樹應(yīng)用場景
3、 決策樹應(yīng)用案例
4、 信息熵
5、 ID3算法
6、 C4.5算法
7、 CART算法
8、 決策樹算法
9、 剪枝
10、 過擬合與調(diào)參
11、 決策樹算法原理
12、 決策樹法的決策過程
13、 案例:Python語言實(shí)現(xiàn)決策樹模型
14、 課堂實(shí)操:Python語言實(shí)現(xiàn)決策樹模型
15、 隨機(jī)森林
案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。
 
研討:Python語言實(shí)現(xiàn)基于聚類的圖像分割方法
Day12
Python數(shù)據(jù)分析案例分享
 
第1個(gè)主題: 隨機(jī)森林模型原理與實(shí)現(xiàn)(深入剖析隨機(jī)森林原理以及通過Python語言實(shí)現(xiàn)隨機(jī)森林模型)
1、 隨機(jī)森林介紹
2、 隨機(jī)森林的特點(diǎn)
3、 隨機(jī)森林的相關(guān)基礎(chǔ)知識
4、 信息、熵以及信息增益的概念
5、 隨機(jī)森林的生成
6、 隨機(jī)森林算法
7、 隨機(jī)森林算法原理
8、 袋外錯(cuò)誤率(oob error)
9、 隨機(jī)森林應(yīng)用場景
10、 隨機(jī)森林應(yīng)用案例
11、 案例:Python語言實(shí)現(xiàn)隨機(jī)森林模型
12、 課堂實(shí)操:Python語言實(shí)現(xiàn)隨機(jī)森林模型
13、 xgboost
 
第2個(gè)主題: 支持向量機(jī)模型原理與實(shí)現(xiàn)(深入剖析支持向量機(jī)算法原理以及通過Python語言實(shí)現(xiàn)支持向量機(jī)模型)
1、 支持向量機(jī)介紹
2、 支持向量機(jī)應(yīng)用場景
3、 支持向量機(jī)應(yīng)用案例
4、 支持向量機(jī)算法
5、 支持向量機(jī)算法原理
6、 線性可分支持向量機(jī)
7、 間隔最大化和支持向量
8、 對偶問題求解
9、 柆格朗日函數(shù)
10、 非線性支持向量機(jī)和核函數(shù)
a)      超平面
b)     線性核
c)      多項(xiàng)式核
d)     高斯核
e)     拉普拉斯核
f)      sigmiod核
11、 線性支持向量機(jī)(軟間隔支持向量機(jī))與松弛變量
12、 松馳因子
13、 案例:Python語言實(shí)現(xiàn)支持向量機(jī)模型
14、 課堂實(shí)操:Python語言實(shí)現(xiàn)基于SVM的字符識別方法
 
第3個(gè)主題: 神經(jīng)網(wǎng)絡(luò)模型原理與實(shí)現(xiàn)(深入剖析神經(jīng)網(wǎng)絡(luò)算法原理以及通過Python語言實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)模型)
1、 神經(jīng)網(wǎng)絡(luò)介紹
2、 神經(jīng)網(wǎng)絡(luò)概念
3、 神經(jīng)網(wǎng)絡(luò)發(fā)展歷史
4、 神經(jīng)網(wǎng)絡(luò)的別名
5、 神經(jīng)網(wǎng)絡(luò)研究的主要內(nèi)容
6、 神經(jīng)網(wǎng)絡(luò)基本構(gòu)成
7、 神經(jīng)網(wǎng)絡(luò)模擬人的智能行為的四個(gè)方面
8、 神經(jīng)網(wǎng)絡(luò)的特點(diǎn)
9、 學(xué)習(xí)能力
10、 適應(yīng)性問題
11、 神經(jīng)網(wǎng)絡(luò)基本網(wǎng)絡(luò)模型
12、 單層網(wǎng)絡(luò)
13、 多層網(wǎng)絡(luò)
14、 循環(huán)網(wǎng)絡(luò)
15、 基本網(wǎng)絡(luò)結(jié)構(gòu)特點(diǎn)
16、 典型訓(xùn)練算法
17、 運(yùn)行方式
18、 典型問題解決方法
19、 感知機(jī)
20、 線性神經(jīng)網(wǎng)絡(luò)
21、 BP神經(jīng)網(wǎng)絡(luò)
22、 RBF網(wǎng)絡(luò)
23、 競爭網(wǎng)絡(luò)
24、 反饋神經(jīng)網(wǎng)絡(luò)
25、 隨機(jī)神經(jīng)網(wǎng)絡(luò)
26、 遺傳算法
27、 PSO與神經(jīng)網(wǎng)絡(luò)優(yōu)化
28、 自定義深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
29、 深度神經(jīng)網(wǎng)絡(luò)的優(yōu)化方法
30、 深度框架的損失函數(shù)
31、 課堂實(shí)操:Python語言實(shí)現(xiàn)基于神經(jīng)網(wǎng)絡(luò)的人臉識別方法
案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。
 
研討:Python語言實(shí)現(xiàn)基于神經(jīng)網(wǎng)絡(luò)的人臉識別方法
Day13
基于spark集群的python數(shù)據(jù)分析實(shí)戰(zhàn)
第1個(gè)主題: 基于Spark集群的Python的數(shù)據(jù)分析實(shí)戰(zhàn)
1、 基于Python開發(fā)Spark 程序概述
2、 基于Python開發(fā)Spark 程序算法庫介紹
3、 基于Python開發(fā)Spark 程序架構(gòu)剖析
4、 基于Python開發(fā)Spark 程序機(jī)器學(xué)習(xí)算法剖析
5、 數(shù)據(jù)類型
6、 基本統(tǒng)計(jì)算法
7、 分類與回歸
8、 協(xié)同過濾
9、 聚類
10、 降維
11、 特征提取與轉(zhuǎn)換
12、 頻繁模式挖掘
13、 評價(jià)指標(biāo)
14、 基于Python開發(fā)Spark 程序編程
15、 基于Python開發(fā)Spark 程序APIs介紹
16、 基于Python開發(fā)Spark 程序機(jī)器學(xué)習(xí)算法應(yīng)用實(shí)戰(zhàn)
17、 基于Python開發(fā)Spark 程序?qū)崙?zhàn)案例:數(shù)據(jù)聚類分析案例剖析
案例練習(xí):通過基于Python開發(fā)Spark 程序?qū)崙?zhàn)案例:數(shù)據(jù)聚類分析案例剖析,剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。
 
研討:數(shù)據(jù)聚類分析案例
 
 

(5)教學(xué)實(shí)驗(yàn)

數(shù)據(jù)分析概述:
1、大數(shù)據(jù)企業(yè)應(yīng)用障礙分析
數(shù)據(jù)的產(chǎn)生、導(dǎo)入與預(yù)處理:
案例練習(xí):通過數(shù)據(jù)整理的編程和應(yīng)用案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。
案例練習(xí):通過案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。
案例練習(xí):通過淘寶雙十一案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。
案例研討:通過數(shù)據(jù)挖掘案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。
研討:數(shù)據(jù)挖掘
案例練習(xí):通過企業(yè)實(shí)踐案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。
研討:企業(yè)實(shí)踐案例分享
案例練習(xí):通過數(shù)據(jù)模型的應(yīng)用案例剖析案例的剖析數(shù)據(jù)分析過程,體會數(shù)據(jù)分析的難點(diǎn)和要點(diǎn)。
研討:數(shù)據(jù)模型的應(yīng)用案例剖析
數(shù)據(jù)分析與挖掘基礎(chǔ):
1、課堂實(shí)操:數(shù)據(jù)整理的編程和應(yīng)用
2、企業(yè)OLAP模型設(shè)計(jì)案例剖析
3、實(shí)例分享:淘寶雙十一
4、實(shí)例分享:騰訊QQ
5、實(shí)例分享:百度文庫
6、實(shí)例分享:打車大戰(zhàn)
7、實(shí)驗(yàn):Pig的實(shí)用案例
8、實(shí)驗(yàn):Hive安裝部署
9、實(shí)驗(yàn):Sqoop安裝
10、實(shí)驗(yàn):Sqoop Shell
11、實(shí)驗(yàn):FLume大數(shù)據(jù)架構(gòu)案例分享及實(shí)戰(zhàn)演練
12、實(shí)驗(yàn):企業(yè)實(shí)踐案例分享
 
R語言數(shù)據(jù)分析實(shí)戰(zhàn):
1、實(shí)驗(yàn):安裝R語言
2、實(shí)驗(yàn):R語言編程案例
3、實(shí)驗(yàn):R語言的繪圖功能
4、實(shí)操:R和MySQL的交互
5、實(shí)操:R和Oracle的交互
6、實(shí)操:R和Excel的交互
7、案例:蒙特卡羅模擬的應(yīng)用
8、案例1:汽車數(shù)據(jù)描述統(tǒng)計(jì)分析
9、案例2:財(cái)政收入與稅收描述統(tǒng)計(jì)分析
10、案例:蒙特卡羅模擬的應(yīng)用
11、實(shí)操:R語言實(shí)現(xiàn)蒙特卡羅求圓周率
12、實(shí)操:R語言一元線性回歸模型檢驗(yàn)
13、實(shí)操:R語言實(shí)現(xiàn)多元線性回歸
14、實(shí)操:R語言非線性回歸
15、案例:用戶離網(wǎng)預(yù)測
16、案例:中國稅收收入增長案例分析
17、案例:新教學(xué)方法的效果
18、案例:信用卡違約預(yù)測
19、案例分享:文章分類
 
大數(shù)據(jù)工具介紹之Hadoop:
1、實(shí)例分享:馬云預(yù)測經(jīng)濟(jì)危機(jī)案例剖析
2、實(shí)例分享:雙十一億背后的開源技術(shù)
3、實(shí)驗(yàn):Hadoop集群部署
4、實(shí)驗(yàn):CLI操作HDFS
5、實(shí)驗(yàn):Java操作HDFS
6、實(shí)驗(yàn):MapReduce命令操作
7、實(shí)驗(yàn):MapReduce程序打包并在命令行運(yùn)行
8、實(shí)驗(yàn):動(dòng)手編寫MapReduce程序
 
 
大數(shù)據(jù)工具介紹之Spark:
1、編程實(shí)戰(zhàn):第一個(gè)Scala 程序
2、編程實(shí)戰(zhàn):編程Scala程序?qū)嵗?br /> 3、編程實(shí)戰(zhàn):Scala函數(shù)編程實(shí)例
4、編程實(shí)戰(zhàn):Scala語言復(fù)雜數(shù)據(jù)類型編程實(shí)戰(zhàn)
5、編程實(shí)戰(zhàn):用SBT對Scala項(xiàng)目打包與發(fā)布
6、實(shí)驗(yàn):Spark集群部署
7、實(shí)驗(yàn):Scala編寫Spark程序
8、實(shí)驗(yàn):Python編寫Spark程序
9、實(shí)驗(yàn):Spark Shell
10、編程實(shí)戰(zhàn):Spark基礎(chǔ)操作編程實(shí)戰(zhàn)
11、企業(yè)級案例:Spark Streaming與Kafka整合實(shí)現(xiàn)數(shù)據(jù)實(shí)時(shí)數(shù)據(jù)分析處理設(shè)計(jì)與分析
 
Pyspark集群調(diào)度與數(shù)據(jù)處理:
1、編程實(shí)戰(zhàn):Spark基礎(chǔ)操作編程實(shí)戰(zhàn)
2、PySpark MLlib實(shí)戰(zhàn)案例:數(shù)據(jù)聚類分析案例剖析
3、案例:Python編寫Spark大數(shù)據(jù)程序
 
大數(shù)據(jù)可視化:
1、可視化案例實(shí)戰(zhàn):數(shù)據(jù)占比柏拉圖繪制
2、可視化案例實(shí)戰(zhàn):儀表盤制作
3、實(shí)驗(yàn):柏拉圖制作
4、實(shí)驗(yàn):儀表盤制作
5、實(shí)驗(yàn):玫瑰圖制作
6、實(shí)驗(yàn):熱力圖制作
7、實(shí)驗(yàn):地圖制作
8、實(shí)驗(yàn):文字云制作
9、淘寶24小時(shí)生活數(shù)據(jù)可視化案例
10、無線淘寶數(shù)據(jù)可視化案例
11、Google公司數(shù)據(jù)可視化案例
12、Facebook用戶畫像可視化案例
13、個(gè)人用戶畫像案例
14、如何撰寫一份優(yōu)秀的數(shù)據(jù)分析報(bào)告
 
Python與數(shù)據(jù)分析實(shí)戰(zhàn):
1、案例實(shí)戰(zhàn):正則表達(dá)式在爬蟲中應(yīng)用實(shí)例
2、案例:Python語言實(shí)現(xiàn)運(yùn)營商數(shù)據(jù)分析處理
3、實(shí)驗(yàn):Python語言自定義函數(shù)
4、案例:Python語言實(shí)現(xiàn)蒙特卡羅求圓周率
5、課堂實(shí)操:數(shù)據(jù)整理的編程和應(yīng)用
6、案例:Python語言實(shí)現(xiàn)購物藍(lán)關(guān)聯(lián)規(guī)則分析
7、課堂實(shí)操:Python語言實(shí)現(xiàn)隨機(jī)森林模型
8、課堂實(shí)操:Python語言實(shí)現(xiàn)金融數(shù)據(jù)時(shí)間序列建模
9、課堂實(shí)操:基于余弦相似度的精準(zhǔn)營銷
10、案例分享:文章分類
11、案例:Python編寫Spark大數(shù)據(jù)程序

講師 劉暉 介紹

大慶油田技術(shù)研究院高級內(nèi)訓(xùn)講師
(原)中興通訊學(xué)院高級講師;
北大計(jì)算機(jī)、北郵通信雙學(xué)位
15年嵌入式硬件、軟件開發(fā)和系統(tǒng)架構(gòu)設(shè)計(jì)總監(jiān)
有8年多的“云大智物”開發(fā)及實(shí)施經(jīng)驗(yàn)。曾供職于巨龍通信、大唐電信,PHILIPS三星聯(lián)合研發(fā)中心等

【工作經(jīng)歷】
長期從事智慧家居、智慧養(yǎng)老、物聯(lián)網(wǎng)應(yīng)用、移動(dòng)互聯(lián)網(wǎng)應(yīng)用研發(fā)工作,曾負(fù)責(zé)北京市科委,大慶油田數(shù)據(jù)化等多個(gè)重點(diǎn)項(xiàng)目,發(fā)表相關(guān)論文多篇,授權(quán)及申請物聯(lián)網(wǎng)方面的專利10多個(gè)。目前主要從事智慧家居、智慧養(yǎng)老、車聯(lián)網(wǎng)、交通物流、物聯(lián)網(wǎng)應(yīng)用平臺以及相關(guān)應(yīng)用方面的研究,實(shí)戰(zhàn)派資深講師。
蘭州交大成教學(xué)院等高校特聘技術(shù)類講師;,參與了我國自主通信標(biāo)準(zhǔn)TD-SCDMA的標(biāo)準(zhǔn)編寫工作,是最早一批參與TD-SCDMA研究的技術(shù)人員;歷任高級軟件開發(fā)工程師,系統(tǒng)架構(gòu)師,物聯(lián)網(wǎng)架構(gòu)師,嵌入式開發(fā)主管等職位,目前是教授級高工,已進(jìn)入北京市、深圳市專家?guī)烀?,深圳市物?lián)網(wǎng)協(xié)會資深專家。

【培訓(xùn)特點(diǎn)】
理論基礎(chǔ)深厚,邏輯思維能力強(qiáng),擁有豐富的企業(yè)授課經(jīng)驗(yàn),對企業(yè)員工培養(yǎng)具有深刻認(rèn)識。授課過程中,緊密結(jié)合成人教育特點(diǎn),靈活運(yùn)用豐富案例,善于以點(diǎn)帶面,啟發(fā)思維。授課風(fēng)格互動(dòng)性和實(shí)操性很強(qiáng),注重講師與學(xué)員之間的互動(dòng)性,使得課堂氛圍輕松愉快,倡導(dǎo)分享和共同進(jìn)步,深受到學(xué)員的歡迎。

上一篇:工業(yè)互聯(lián)網(wǎng)
下一篇:創(chuàng)新業(yè)務(wù)解決方案

培訓(xùn)現(xiàn)場