- 爬蟲崗位職責(zé) 推薦度:
- 相關(guān)推薦
爬蟲崗位職責(zé)
在現(xiàn)實(shí)社會(huì)中,崗位職責(zé)起到的作用越來越大,崗位職責(zé)具有提高內(nèi)部競爭活力,更好地發(fā)現(xiàn)和使用人才的作用。想學(xué)習(xí)制定崗位職責(zé)卻不知道該請(qǐng)教誰?下面是小編幫大家整理的爬蟲崗位職責(zé),歡迎大家分享。
爬蟲崗位職責(zé)1
職責(zé)描述:
1,負(fù)責(zé)網(wǎng)絡(luò)爬蟲系統(tǒng)的'設(shè)計(jì)與開發(fā)
2,對(duì)爬取的網(wǎng)頁信息進(jìn)行數(shù)據(jù)抽取,清洗和去重等工作
任職要求:
1、2年及以上網(wǎng)絡(luò)爬蟲開發(fā)經(jīng)驗(yàn),本科及大專學(xué)歷,計(jì)算機(jī)相關(guān)專業(yè),
2、積極、溝通順暢,工作認(rèn)真負(fù)責(zé)
3、扎實(shí)的編程能力,熟悉常用算法和數(shù)據(jù)結(jié)構(gòu)等基礎(chǔ)知識(shí)
4、熟練掌握開發(fā)語言java或c/c++,熟悉腳本語言和正則表達(dá)式
爬蟲崗位職責(zé)2
職位描述:
工作職責(zé):
1.開發(fā)網(wǎng)頁自動(dòng)化腳本。
2.負(fù)責(zé)商品信息結(jié)構(gòu)化,編寫自動(dòng)化腳本解析網(wǎng)頁信息。
3.商品索引系統(tǒng):億級(jí)sku的庫存價(jià)格實(shí)時(shí)跟蹤同步,并對(duì)商品進(jìn)行智能分類、本地化、圖片處理和去重。
4.設(shè)計(jì)、開發(fā)、測(cè)試、部署以及維護(hù)并改進(jìn)各子系統(tǒng);
5.管理項(xiàng)目優(yōu)先級(jí)并按時(shí)交付。
職位要求:
1.全日制統(tǒng)招本科、碩士畢業(yè),1年以上軟件開發(fā)工作經(jīng)驗(yàn);
2.熟悉至少一門通用靜態(tài)編譯編程語言,c/c++/java/c#/go;
3.熟悉web端基礎(chǔ)標(biāo)準(zhǔn),包括html、css、javascript、json等;
4.熟悉python或其他腳本語言,有興趣和能力根據(jù)需求學(xué)習(xí)其他編程語言;
5.熟悉unix/linux環(huán)境,memcache/redis/mongodb等存儲(chǔ)系統(tǒng),能獨(dú)立設(shè)計(jì)開發(fā)包括前后端交互的業(yè)務(wù)子系統(tǒng);
6.熟悉常見的設(shè)計(jì)模式、單元測(cè)試、持續(xù)開發(fā)集成、code review,并能在日常工作踐行;
7.了解搜索引擎、電子商務(wù)、社交類應(yīng)用的`系統(tǒng)基本架構(gòu),能對(duì)已有的子系統(tǒng)進(jìn)行優(yōu)化調(diào)整的優(yōu)先;
8.活躍的開源項(xiàng)目貢獻(xiàn)者優(yōu)先。
爬蟲崗位職責(zé)3
職位要求:
具備良好的計(jì)算機(jī)基礎(chǔ),熟悉http協(xié)議,具備良好的`基礎(chǔ)前端知識(shí);
有過良好的高并發(fā)系統(tǒng)的后臺(tái)開發(fā)經(jīng)驗(yàn);
具備一定的數(shù)據(jù)處理/分析經(jīng)驗(yàn),熟悉hadoop、mapreduce、spark等并行計(jì)算框架;
了解小程序的基礎(chǔ)框架,有實(shí)際開發(fā)經(jīng)驗(yàn)更優(yōu);
掌握c/c++、python等一門或多門語言,有nodejs開發(fā)經(jīng)驗(yàn)更優(yōu);
如果您還具備以下技能,我們會(huì)優(yōu)先考慮:
具備網(wǎng)絡(luò)爬蟲系統(tǒng)的開發(fā)經(jīng)驗(yàn),有反爬蟲實(shí)踐經(jīng)驗(yàn);
具備機(jī)器學(xué)習(xí)框架的開發(fā)使用經(jīng)驗(yàn);
熟悉傳統(tǒng)搜索引擎的seo規(guī)則。
爬蟲崗位職責(zé)4
職責(zé)描述:
1.參與爬蟲系統(tǒng)的架構(gòu)設(shè)計(jì)與開發(fā);
2.負(fù)責(zé)執(zhí)行和開發(fā)分布式網(wǎng)絡(luò)爬蟲系統(tǒng),進(jìn)行多平臺(tái)信息的抓取和分析;
3.負(fù)責(zé)網(wǎng)頁信息和app數(shù)據(jù)抽取、清洗、消重等工作,提升平臺(tái)的抓取效率;
4.參與爬蟲核心算法和策略優(yōu)化,熟悉采集系統(tǒng)的.調(diào)度策略;
5.實(shí)時(shí)監(jiān)控爬蟲的進(jìn)度和警報(bào)反饋。
任職要求:
1.本科以上學(xué)歷,3年以上爬蟲開發(fā)相關(guān)經(jīng)驗(yàn),熟練使用python或java進(jìn)行開發(fā);
2.熟練使用正則表達(dá)式、css path、xpath等,能夠從結(jié)構(gòu)化的和非結(jié)構(gòu)化的數(shù)據(jù)中獲取信息;
3.熟練使用mysql數(shù)據(jù)庫,掌握redis、mongodb、hive等常用nosql技術(shù)并具有實(shí)戰(zhàn)經(jīng)驗(yàn);
4.熟悉各種抓取技術(shù),包括代理、phantomjs/selenium、驗(yàn)證碼處理;
5.熟悉整個(gè)爬蟲的設(shè)計(jì)及實(shí)現(xiàn)流程,有從事網(wǎng)絡(luò)爬蟲、網(wǎng)頁信息抽取開發(fā)經(jīng)驗(yàn),熟悉反爬蟲技術(shù),有分布式爬蟲架構(gòu)經(jīng)驗(yàn);
6.具有數(shù)據(jù)挖掘、自然語言處理、信息檢索、機(jī)器學(xué)習(xí)背景者優(yōu)先;
7.快速學(xué)習(xí)能力,工作積極主動(dòng),有創(chuàng)業(yè)熱情和良好的團(tuán)隊(duì)協(xié)助能力;
8.需要有大量數(shù)據(jù)爬取以及高難度反爬經(jīng)驗(yàn),沒有相關(guān)經(jīng)驗(yàn)的勿擾。
爬蟲崗位職責(zé)5
職位描述:
工作職責(zé):
1、負(fù)責(zé)設(shè)計(jì)和開發(fā)分布式網(wǎng)絡(luò)爬蟲系統(tǒng),進(jìn)行多平臺(tái)信息的抓取和分析工作;
2、負(fù)責(zé)網(wǎng)頁信息和app數(shù)據(jù)抽取、清洗、消重等工作,提升平臺(tái)的.抓取效率;
3、參與爬蟲核心算法和策略優(yōu)化,熟悉采集系統(tǒng)的調(diào)度策略;
4、實(shí)時(shí)監(jiān)控爬蟲的進(jìn)度和警報(bào)反饋。
任職要求:
1、有扎實(shí)的算法和數(shù)據(jù)結(jié)構(gòu)能力;
2、熟悉爬蟲原理,熟悉常見的反爬蟲技術(shù),有爬蟲相關(guān)項(xiàng)目開發(fā)經(jīng)驗(yàn)者優(yōu)先;
3、掌握http協(xié)議,熟悉html、dom、xpath等常見的數(shù)據(jù)抽取技術(shù);
4、有大規(guī)模數(shù)據(jù)處理、數(shù)據(jù)挖掘、信息提取等經(jīng)驗(yàn)者優(yōu)先。
爬蟲崗位職責(zé)6
職位描述:
1、負(fù)責(zé)廣告素材線索和垂直類產(chǎn)品爬蟲系統(tǒng)的設(shè)計(jì)、開發(fā)
2、抓取數(shù)據(jù)的'清洗、落地、分析
3、抓取策略算法的更新維護(hù),以及確保數(shù)據(jù)抽取準(zhǔn)確、高效
任職要求:
1、具備強(qiáng)悍的編碼能力、扎實(shí)的數(shù)據(jù)結(jié)構(gòu)和算法功底
2、熟悉tcp,http協(xié)議原理;熟悉ajax工作原理;精通python編程,熟悉一種開源爬蟲框架和源碼;
3、有爬蟲、信息抽取、文本分類、大數(shù)據(jù)處理相關(guān)經(jīng)驗(yàn)優(yōu)先
4、有自然語言處理、機(jī)器學(xué)習(xí)經(jīng)驗(yàn)優(yōu)先
爬蟲崗位職責(zé)7
崗位職責(zé):
1.負(fù)責(zé)網(wǎng)絡(luò)爬蟲的`架構(gòu)設(shè)計(jì)、開發(fā)與優(yōu)化;
2.負(fù)責(zé)抓取數(shù)據(jù)的清洗、落地、分析;
3.抓取策略算法的更新維護(hù),以及確保數(shù)據(jù)抽取準(zhǔn)確、高效。
任職要求:
1.兩年及以上互聯(lián)網(wǎng)或軟件行業(yè)工作經(jīng)驗(yàn);
2.理解http協(xié)議,熟悉html、dom、xpath;
3.熟悉linux開發(fā)環(huán)境,至少熟悉python/go/java/node.js中的一種編程語言;
4.有爬蟲、信息抽取、文本分類、大數(shù)據(jù)處理相關(guān)經(jīng)驗(yàn)優(yōu)先;
5.有自然語言處理、機(jī)器學(xué)習(xí)經(jīng)驗(yàn)優(yōu)先;
6.熟悉瀏覽器內(nèi)核、渲染機(jī)制優(yōu)先;
7.工作認(rèn)真,細(xì)心,有條理,積極性高;良好的溝通能力及團(tuán)隊(duì)合作精神。
爬蟲崗位職責(zé)8
崗位職責(zé)
1.熟悉線程池、并發(fā)機(jī)制、鎖機(jī)制、線程安全原理;
2.java體系知識(shí):網(wǎng)絡(luò)io、設(shè)計(jì)模式、linux、jvm、java類加載機(jī)制、java內(nèi)存模型;
3.爬蟲經(jīng)驗(yàn):webmagic、adsl撥號(hào)、正則表達(dá)式、脫殼技術(shù)、加密、圖片破解、二維碼識(shí)別、滑塊驗(yàn)證碼破解、httpclient、分詞、分布式爬蟲調(diào)度、數(shù)據(jù)質(zhì)量監(jiān)控、代理ip調(diào)度算法、配置化爬蟲、授權(quán)爬蟲、輿情、應(yīng)用市場(chǎng)、反爬;
4.熟悉http/http、tcp/ip、socket等通訊協(xié)議;
5.6年以上軟件開發(fā)經(jīng)驗(yàn),至少2年爬蟲開發(fā)經(jīng)驗(yàn)。
任職要求
1.采集、清洗、監(jiān)控、配置化、調(diào)度、反爬、數(shù)據(jù)爬取、分詞、檢索等數(shù)據(jù)采集研發(fā);
2.較強(qiáng)的邏輯思維和發(fā)散思維;
3.計(jì)算機(jī)或相關(guān)專業(yè)本科及以上學(xué)歷。
【爬蟲崗位職責(zé)】相關(guān)文章:
爬蟲崗位職責(zé)12篇02-19
值班崗位職責(zé)-崗位職責(zé)07-25
it部經(jīng)理崗位職責(zé)-崗位職責(zé)07-25
物業(yè)班長崗位職責(zé)-崗位職責(zé)11-03
庫管崗位職責(zé)-崗位職責(zé)01-10