400-888-5228

課程簡(jiǎn)介

Python作為一門腳本語(yǔ)言,它靈活、易用、易學(xué)、適用場(chǎng)景多,實(shí)現(xiàn)程序快捷便利,早已經(jīng)成為程序員們的一門編程利器。從小到服務(wù)器運(yùn)維的腳本,到大型軟件開發(fā),使用python都能夠很靈活的快速實(shí)現(xiàn)。python不但可以快速實(shí)現(xiàn)大型的web應(yīng)用程序,在網(wǎng)絡(luò)層的開發(fā),以及工程計(jì)算、數(shù)學(xué)計(jì)算上都有方便的開發(fā)手段。Map&Reduce思想在python里面也有著非常方便的實(shí)現(xiàn)。甚至在一些嵌入式設(shè)備上,你也可以實(shí)現(xiàn)自己的python應(yīng)用。諸如著名的云計(jì)算框架openstack之類很多編程應(yīng)用,都能見(jiàn)到python的身影。

隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡(luò)信息呈現(xiàn)指數(shù)式增長(zhǎng),要在短時(shí)間內(nèi)獲取大量信息,網(wǎng)絡(luò)爬蟲無(wú)疑是一種最適合的方法。通過(guò)爬蟲獲取的海量信息,我們可以對(duì)其進(jìn)行進(jìn)一步的分析:市場(chǎng)預(yù)測(cè)、文本分析、機(jī)器學(xué)習(xí)方法等。本課程會(huì)艾威培訓(xùn)資深的Python講師結(jié)合自已多年的工作經(jīng)驗(yàn),從爬蟲的基本知識(shí)入手,使用Python作為實(shí)現(xiàn)工具,一步步地講述網(wǎng)絡(luò)爬蟲的實(shí)現(xiàn)。

 

培訓(xùn)天數(shù)

2天

課程內(nèi)容

第1單元 網(wǎng)絡(luò)爬蟲初識(shí)與Python使用基礎(chǔ)

第2單元 爬蟲設(shè)計(jì)基礎(chǔ)

第3單元 分布式爬蟲:Google的成功之道

第4單元Python的正勻則表達(dá)式

第5單元 復(fù)雜HTML解析

第6單元 網(wǎng)絡(luò)數(shù)據(jù)采集

第7單元 API初認(rèn)識(shí)

第8單元 API的使用

第9單元 爬蟲數(shù)據(jù)的存儲(chǔ)與文檔的讀取

第10單元 自然語(yǔ)言處理

第11單元 高級(jí)數(shù)據(jù)采集:JavaScript與圖形識(shí)別

第12單元 爬蟲測(cè)試

第13單元 遠(yuǎn)程采集