EditorTools2(全自動(dòng)采集器)
- 類型:國(guó)產(chǎn)軟件
- 授權(quán):免費(fèi)軟件
- 更新:2023-11-28
- 廠商:自在工坊
- 標(biāo)簽: 數(shù)據(jù)采集工具
- 環(huán)境:Windows11,Windows10,Windows8,Windows7
- 本地下載
詳情介紹
相信對(duì)于從事網(wǎng)站領(lǐng)域的站長(zhǎng)朋友來說都知道,一個(gè)網(wǎng)站想要保持活力,引入流量,則每日的內(nèi)容更新是最基礎(chǔ)的操作。為此今日小編就為大家?guī)砹艘豢罘浅I(yè)且好用的網(wǎng)絡(luò)內(nèi)容全自動(dòng)采集器工具—EditorTools2最終版,軟件經(jīng)由自在工坊精心打造,不僅綠色小巧,完全免費(fèi)、還支持免安裝、免激活、免注冊(cè)等繁瑣的安裝步驟,讓大家只需一鍵下載打開就能在線使用。同時(shí)EditorTools2相比較市面上大多數(shù)同類型軟件而言,可以說是一個(gè)中小網(wǎng)站自動(dòng)更新利器,功能強(qiáng)大,使用便捷、還具備了ET采集,釋放自由,易用、穩(wěn)定、低耗等一些特色亮點(diǎn),更為重要的是操作過程中無需人工值守,24小時(shí)自動(dòng)實(shí)時(shí)監(jiān)控目標(biāo),晝夜不停為您提供內(nèi)容更新。還有提供多種智能化的采集方案,可全方位保障貴網(wǎng)站的優(yōu)質(zhì)和及時(shí)的內(nèi)容更新,并在滿足長(zhǎng)期運(yùn)行需求下,將您從繁重、枯燥的網(wǎng)站更新工作中解脫出來,就是這么簡(jiǎn)單、高效、實(shí)用。歡迎有需要的朋友前來3322軟件站免費(fèi)下載體驗(yàn)試試看哦!
無需人工值守,24小時(shí)自動(dòng)實(shí)時(shí)監(jiān)控目標(biāo),實(shí)時(shí)高效采集,晝夜不停為您提供內(nèi)容更新。滿足長(zhǎng)期運(yùn)行需求,將您從繁重工作中解脫
2、【適用廣泛】
最全能的采集軟件,支持任意類型網(wǎng)站采集,適用率高達(dá)99.9%,支持發(fā)布到所有類型網(wǎng)站程序,更可以采集本地文件,免借口發(fā)布
3、【信息隨心所欲】
支持信息自由組合,通過強(qiáng)大的數(shù)據(jù)整理功能對(duì)信息深度加工,創(chuàng)造全新內(nèi)容
4、【任意格式文件下載】
不論靜態(tài)或動(dòng)態(tài),不論是圖片、音樂、電影、軟件、又或者是PDF、WORD文檔甚至是種子文件,只要你想
5、【偽原創(chuàng)】
高速同近義詞替換、多詞隨機(jī)替換、段落隨機(jī)排序,助力內(nèi)容SEO
6、【無限多級(jí)頁(yè)面采集】
從支持多級(jí)目錄開始,無論是垂直方向多層信息頁(yè)面,還是平行方向復(fù)數(shù)內(nèi)容分頁(yè),抑或AJAX調(diào)用頁(yè)面,為你輕松采集
7、【自由擴(kuò)展】
開放的接口模式,可以自由二次開發(fā),自定義任何功能,實(shí)現(xiàn)所有需求
2、與網(wǎng)站分離,通過獨(dú)立制作的接口,可以支持任何網(wǎng)站或數(shù)據(jù)庫(kù)
3、靈活強(qiáng)大的采集規(guī)則不僅僅是采集文章,可采集任何類型信息
4、小巧、低耗和良好的穩(wěn)定性非常適合運(yùn)行于服務(wù)器
5、所有規(guī)則都可以導(dǎo)入導(dǎo)出,靈活的資
6、采用FTP上傳文件,穩(wěn)定、安全
7、下載上傳支持?jǐn)帱c(diǎn)續(xù)傳
8、高速偽原創(chuàng)
9、可選擇倒序、順序、隨機(jī)采集文章
10、支持自動(dòng)列表網(wǎng)址
11、支持對(duì)數(shù)據(jù)分布在多層頁(yè)面的網(wǎng)站進(jìn)行采集
12、自由設(shè)定采集數(shù)據(jù)項(xiàng),并可單獨(dú)過濾整理每個(gè)數(shù)據(jù)項(xiàng)
13、支持分頁(yè)內(nèi)容采集
14、支持任意格式、類型的文件(包括圖片、視頻)下載
15、可突破防盜鏈文件
16、支持動(dòng)態(tài)文件網(wǎng)址分析
17、支持對(duì)需登錄訪問的網(wǎng)頁(yè)的采集
18、可設(shè)定關(guān)鍵詞采集
19、可設(shè)定防止采集的敏感詞
20、可設(shè)置圖片水印
21、支持發(fā)布帶回復(fù)的文章,可廣泛用于論壇、博客等項(xiàng)目
22、與采集數(shù)據(jù)分離的發(fā)布參數(shù)項(xiàng),可自由對(duì)應(yīng)采集數(shù)據(jù)或預(yù)設(shè)數(shù)值,極大增強(qiáng)發(fā)布規(guī)則的重用性
23、支持隨機(jī)選用發(fā)布賬號(hào)
24、支持任意發(fā)布項(xiàng)語(yǔ)言翻譯
25、支持編碼轉(zhuǎn)換、支持UBB代碼
26、文件上傳可選擇好自動(dòng)建立年月日子目錄
27、模擬發(fā)布支持對(duì)無法安裝接口的網(wǎng)站進(jìn)行發(fā)布操作
28、方案可定時(shí)工作
29、防止網(wǎng)絡(luò)運(yùn)營(yíng)商劫持HTTP功能
30、可手動(dòng)進(jìn)行單項(xiàng)采集發(fā)布
31、詳盡的工作流程監(jiān)視、信息反饋,讓您迅速了解工作狀態(tài)
1、通過登記,獲得ET的使用授權(quán);
打開 主菜單-授權(quán)登記 ,填寫您在ET官方網(wǎng)站(非論壇)注冊(cè)的有效帳號(hào),進(jìn)行使用登記,即可獲得ET的使用授權(quán)
二、【系統(tǒng)設(shè)置】
打開 主菜單-系統(tǒng)-基本設(shè)置 ,進(jìn)行各種系統(tǒng)設(shè)置,見圖示
1、設(shè)置工作參數(shù);
根據(jù)您的需要設(shè)置工作參數(shù),見圖示
①、開機(jī)自動(dòng)運(yùn)行ET:?jiǎn)?dòng)電腦進(jìn)入系統(tǒng)后,自動(dòng)運(yùn)行ET程序;
②、ET啟動(dòng)后自動(dòng)工作:ET啟動(dòng)運(yùn)行后,自動(dòng)執(zhí)行上一次使用ET時(shí)勾選的工作方案,只有啟用本項(xiàng),才會(huì)自動(dòng)保存當(dāng)前勾選的工作方案;
③、啟動(dòng)后最小化:ET啟動(dòng)后,隱藏主窗口,只顯示托盤圖標(biāo);
④、忽略規(guī)則首尾空白:?jiǎn)⒂帽卷?xiàng)后,采集配置中的各個(gè)規(guī)則將自動(dòng)去除首尾的空格、回車、換行等空白字符,以避免用戶多輸入空格或換行導(dǎo)致規(guī)則分析失??;如果用戶需要利⑤、用空格或換行來確定規(guī)則的首尾邊界,則請(qǐng)取消勾選;
⑥、方案執(zhí)行間隔時(shí)間:在進(jìn)行自動(dòng)工作、選擇多個(gè)方案時(shí),一個(gè)方案的當(dāng)前列表采集完后,間隔多久更換采集下一個(gè)方案;
⑦、訪問網(wǎng)絡(luò)超時(shí)時(shí)間:設(shè)定在訪問網(wǎng)絡(luò)時(shí)超過多久無響應(yīng)則強(qiáng)制斷開;
⑧、訪問網(wǎng)絡(luò)重試次數(shù):設(shè)定在訪問網(wǎng)絡(luò)時(shí)遇到失敗的自動(dòng)重試次數(shù),例如采集網(wǎng)頁(yè)、下載文件、FTP上傳等;
⑨、訪問網(wǎng)頁(yè)失敗后自動(dòng)重啟ET:設(shè)定在訪問網(wǎng)頁(yè)失敗一定次數(shù)后自動(dòng)重啟ET,以解決一些可能出現(xiàn)網(wǎng)絡(luò)阻塞導(dǎo)致無法繼續(xù)正常工作的問題;本功能僅在自動(dòng)工作時(shí)生效,停止自動(dòng)工作將重置失敗計(jì)數(shù),重試訪問不計(jì)數(shù);
2、設(shè)置代理
如果您通過代理上網(wǎng),請(qǐng)?jiān)O(shè)置訪問網(wǎng)頁(yè)的代理參數(shù),見圖示
僅用于采集:勾選本項(xiàng),將會(huì)使代理設(shè)置僅在采集網(wǎng)頁(yè)時(shí)生效,發(fā)布時(shí)不使用代理,這是2.3.8版中新增功能
3、設(shè)置劫持特征代碼
很多地區(qū)的電信寬帶用戶在上網(wǎng)時(shí),會(huì)被強(qiáng)行在訪問信息中,用一些代碼替換訪問信息,讓用戶只能通過代碼中的框架查看原本要訪問的網(wǎng)頁(yè),這通常用來顯示電信的廣告或進(jìn)行其他隱秘的動(dòng)作,這種行為被稱為劫持瀏覽器;當(dāng)出現(xiàn)這種情況時(shí),ET所采集的源碼也只能得到這些劫持代碼,而不是要采集的網(wǎng)頁(yè)源碼。通過設(shè)置這些劫持代碼的特征字符串,ET會(huì)嘗試突破劫持訪問真實(shí)的網(wǎng)頁(yè)源碼,最多可以重試5次訪問該網(wǎng)址
4、設(shè)置UserAgent
網(wǎng)站通過userAgent來判斷當(dāng)前用戶使用的是什么瀏覽器,并根據(jù)這個(gè)瀏覽器能夠支持的情況提供相應(yīng)的功能。瀏覽器在訪問一個(gè)網(wǎng)頁(yè)時(shí)通常會(huì)傳送一個(gè)識(shí)別字串告訴網(wǎng)站它是什么瀏覽器軟件,我們?cè)L問的部分網(wǎng)站會(huì)對(duì)UserAgent進(jìn)行限制,我們可以在基本設(shè)置中修改UserAgent,也可以點(diǎn)擊'獲取本機(jī)UserAgent'按鈕獲得本機(jī)的IE默認(rèn)UserAgent
5、設(shè)置支持語(yǔ)言
采集某些網(wǎng)頁(yè)時(shí),網(wǎng)站可能會(huì)檢查支持的語(yǔ)言,用戶可以在此調(diào)整。
6、鎖定設(shè)置
打開 主菜單-系統(tǒng)-鎖定設(shè)置 ,見圖示:
此功能用于設(shè)置打開各個(gè)配置窗口時(shí)的密碼,當(dāng)設(shè)置了鎖定密碼后,使用 菜單-鎖定 功能,即可在用戶離開電腦后,防止他人訪問操作各項(xiàng)配置
三、【前臺(tái)使用操作】
1、【選擇工作方案】
工作方案包含了從來源獲取原始信息、信息加工處理、最終發(fā)布到目標(biāo)網(wǎng)站一系列工作的全部設(shè)定指令,是ET進(jìn)行自動(dòng)采集工作的指揮官,當(dāng)制定好我們需要的方案后(方案制訂見 用戶手冊(cè) - 設(shè)置篇),即可在主窗口選擇工作方案,開始采集工作。
①、認(rèn)識(shí)方案區(qū);
主窗口左側(cè)上方的樹形目錄區(qū)即為方案區(qū),點(diǎn)擊鼠標(biāo)右鍵,彈出操作菜單
②、勾選方案;
點(diǎn)擊方案名前的選擇框,選中將要執(zhí)行的方案,可以多選,
如果所選方案缺少關(guān)鍵性配置,將顯示提示,并將取消選中
ET工作時(shí),將首先從當(dāng)前的焦點(diǎn)方案開始執(zhí)行,即藍(lán)色反亮顯示的方案,見圖示4中的‘網(wǎng)站-discuz 6.0(帶回復(fù))’
選中的多個(gè)方案,將循環(huán)執(zhí)行。
在主窗口右側(cè)上方的文章列表區(qū),將顯示勾選的焦點(diǎn)方案的待處理文章。
在方案名稱上點(diǎn)右鍵,彈出菜單見圖示
點(diǎn)編輯方案,會(huì)進(jìn)入該方案編輯窗口
雙擊方案名稱,也可以直接進(jìn)入該方案編輯窗口。
2、自動(dòng)工作
選擇好將要執(zhí)行的工作方案后,點(diǎn)擊主窗口左側(cè)下方的‘自動(dòng)’按鈕,即可開始全自動(dòng)工作,用戶從此時(shí)起可以扔掉鼠標(biāo)鍵盤、拋開繁累的網(wǎng)站更新,與朋友結(jié)伴出游,網(wǎng)站內(nèi)容自有ET為您默默收集更新,要停止自動(dòng)工作,請(qǐng)點(diǎn)擊‘停止’按鈕;
ET支持命令行啟動(dòng),參數(shù) /auto 可啟動(dòng)自動(dòng)工作,命令行使用示例:d:\editortools.exe /auto
3、手動(dòng)工作
在進(jìn)行方案調(diào)試時(shí),通常會(huì)使用手動(dòng)方式進(jìn)行采集操作。
①、采集目錄;
點(diǎn)擊主窗口左側(cè)下方的‘采集目錄’按鈕,ET將對(duì)當(dāng)前選中的焦點(diǎn)方案執(zhí)行目錄采集動(dòng)作,若無焦點(diǎn)方案則按順序執(zhí)行
采集到的目錄信息則顯示在主窗口右側(cè)上方的文章列表區(qū),
注意:當(dāng)方案的采集規(guī)則有修改時(shí),會(huì)自動(dòng)清空未發(fā)布文章,包括發(fā)送失敗的文章,以避免用戶繼續(xù)使用錯(cuò)誤的文章條目來采集
②、處理文章;
當(dāng)文章列表區(qū)中有待處理文章時(shí),點(diǎn)擊主窗口左側(cè)下方的‘處理文章’按鈕,將按順序?qū)ξ恼铝斜韰^(qū)的第一項(xiàng)待處理文章執(zhí)行采集動(dòng)作
文章處理過程中,在主窗口右側(cè)下方的信息區(qū),將顯示工作記錄,
處理結(jié)束后,文章列表區(qū)的對(duì)應(yīng)條目將顯示處理的狀態(tài)
③、另一種手動(dòng)處理文章方式
在文章列表區(qū),雙擊某項(xiàng)文章條目,將對(duì)該篇文章執(zhí)行采集動(dòng)作,無論這篇文章是否已經(jīng)被處理。
4、認(rèn)識(shí)文章列表區(qū)
主窗口右側(cè)上方的表格區(qū)域,即是文章列表區(qū),這里顯示所執(zhí)行方案的待處理文章,
①、文章列表區(qū)各列說明;
文章采集標(biāo)題:這是通過采集規(guī)則-列表分析規(guī)則獲取的文章標(biāo)題,如果該采集規(guī)則未再設(shè)置標(biāo)題數(shù)據(jù)項(xiàng)的分析規(guī)則,那么ET將使用此處的文章采集標(biāo)題作為發(fā)布標(biāo)題,文章采集標(biāo)題可更改,點(diǎn)擊標(biāo)題后的省略號(hào)按鈕 可進(jìn)入編輯狀態(tài)
狀態(tài)-發(fā)送:當(dāng)該項(xiàng)值為YES時(shí),表示該篇文章已成功發(fā)布
狀態(tài)-敏感:當(dāng)該項(xiàng)值為YES時(shí),表示該篇文章正文包含敏感關(guān)鍵詞
狀態(tài)-錯(cuò)誤:0表示無錯(cuò)誤,其他錯(cuò)誤代碼含義請(qǐng)參考相關(guān)主題
狀態(tài)-處理:打勾的文章條目表示已經(jīng)執(zhí)行過,您可以通過點(diǎn)擊取消勾選,使它被再次執(zhí)行
②、轉(zhuǎn)換顯示編碼
在文章列表區(qū)上點(diǎn)右鍵,將彈出編碼菜單
③、雙擊執(zhí)行文章采集;
在上一部分已經(jīng)講過,可以在文章列表區(qū),雙擊某篇文章條目,以執(zhí)行對(duì)它的采集;
④、瀏覽按鈕
點(diǎn)擊文章條目的瀏覽按鈕,可以訪問該篇文章網(wǎng)址,用于確認(rèn)網(wǎng)址是否正確、查看網(wǎng)頁(yè)源代碼等
5、認(rèn)識(shí)信息欄
信息欄用于跟蹤執(zhí)行過程、反饋各種信息,是了解ET工作情況、解決采集所遇問題的重要工具,
①、工作記錄:
該欄記錄ET的每一步工作過程及狀態(tài),包括目錄采集和文章處理兩大部分,我們通過工作記錄可以了解該次采集執(zhí)行是否正確完成,或是出現(xiàn)了什么問題;當(dāng)出現(xiàn)問題時(shí),可以根據(jù)提示、結(jié)合信息欄的其他反饋內(nèi)容,用戶可以迅速準(zhǔn)確地找到故障原因并予解決。
②、采集源碼:
此欄顯示執(zhí)行過程中所采集的文章列表頁(yè)、文章頁(yè)面、文章分頁(yè)等的網(wǎng)頁(yè)源代碼,利用此欄源代碼,可以方便的進(jìn)行規(guī)則測(cè)試、提供規(guī)則定制依據(jù)。
注意,某些網(wǎng)站會(huì)根據(jù)不同來訪瀏覽器而顯示不同的源代碼,所以,ET的采集規(guī)則定制時(shí),應(yīng)以此欄的源代碼為準(zhǔn),例如采集規(guī)則范例中的‘SMF 1.1.5’,其網(wǎng)站通過IE訪問和ET采集獲取到的源碼就有區(qū)別。
③、分析數(shù)據(jù):
此欄顯示文章處理過程中的各個(gè)數(shù)據(jù)項(xiàng)信息,從分析到的原始代碼,到整理后的代碼,再到經(jīng)過URL修正后的代碼,用戶通過查看此欄,可以了解設(shè)置的數(shù)據(jù)項(xiàng)分析規(guī)則是否準(zhǔn)確、整理組規(guī)則是否完善、最終的信息是否符合自己的要求。
例如:當(dāng)工作記錄欄提示錯(cuò)誤‘正文字?jǐn)?shù)大于或小于發(fā)布設(shè)置’時(shí),我們可以查看本欄的‘正文’數(shù)據(jù)項(xiàng),了解具體是大于還是小于發(fā)布設(shè)置,原因是正常還是因?yàn)檎斫M設(shè)置不當(dāng),從而調(diào)整各個(gè)設(shè)置。
④、發(fā)送代碼
此欄顯示ET向發(fā)布網(wǎng)站發(fā)送的數(shù)據(jù),包括文章檢查部分和文章發(fā)布部分;
用戶可以通過此欄信息了解通過一系列分析、整理操作,最終向發(fā)布網(wǎng)站提交的數(shù)據(jù),用以檢查自己的采集規(guī)則數(shù)據(jù)項(xiàng)、發(fā)布規(guī)則的參數(shù)設(shè)置等是否正確、完整。
⑤、返回信息
此欄顯示ET向發(fā)布網(wǎng)站發(fā)送數(shù)據(jù)后發(fā)布網(wǎng)站的反饋,包括文章檢查反饋和文章發(fā)布反饋;
通過查看此欄,我們可以清晰的了解當(dāng)采集過程出現(xiàn)問題時(shí)的大部分原因。
一些接口在返回錯(cuò)誤信息時(shí),信息可能是HTML代碼,不熟悉HTML代碼的用戶閱讀比較吃力,點(diǎn)擊WEB瀏覽按鈕,可以在操作系統(tǒng)默認(rèn)瀏覽器中方便的查看它們
EditorTools 為win32軟件,可以運(yùn)行于 微軟簡(jiǎn)體中文版 Windows xp/2000/2003/2008/vista/win7 等操作系統(tǒng)環(huán)境下。我們已在軟件中針對(duì)上述操作系統(tǒng)做了大量的測(cè)試和實(shí)地檢驗(yàn),保證 EditorTools 可以在上述系統(tǒng)中安全穩(wěn)定的運(yùn)行。
如果您選擇在非簡(jiǎn)體中文的windows操作系統(tǒng)下運(yùn)行ET,那么可能會(huì)遇到界面顯示亂碼等情況,具體需要您自行測(cè)試,通??梢酝ㄟ^安裝標(biāo)準(zhǔn)簡(jiǎn)體中文字庫(kù)(GB2312)解決。
2、【支撐環(huán)境要求】
EditorTools2需要計(jì)算機(jī)具備如下軟件環(huán)境
mdac 2.8或以上版本 (ADO數(shù)據(jù)庫(kù)驅(qū)動(dòng))
已注冊(cè)的scrrun.dll (用于閱讀和編寫腳本和文本文件)
已注冊(cè)的vbscript.dll (VBScript腳本相關(guān)支持文件)
EditorTools2(全自動(dòng)采集器)特色
1、【全自動(dòng)無人值守】無需人工值守,24小時(shí)自動(dòng)實(shí)時(shí)監(jiān)控目標(biāo),實(shí)時(shí)高效采集,晝夜不停為您提供內(nèi)容更新。滿足長(zhǎng)期運(yùn)行需求,將您從繁重工作中解脫
2、【適用廣泛】
最全能的采集軟件,支持任意類型網(wǎng)站采集,適用率高達(dá)99.9%,支持發(fā)布到所有類型網(wǎng)站程序,更可以采集本地文件,免借口發(fā)布
3、【信息隨心所欲】
支持信息自由組合,通過強(qiáng)大的數(shù)據(jù)整理功能對(duì)信息深度加工,創(chuàng)造全新內(nèi)容
4、【任意格式文件下載】
不論靜態(tài)或動(dòng)態(tài),不論是圖片、音樂、電影、軟件、又或者是PDF、WORD文檔甚至是種子文件,只要你想
5、【偽原創(chuàng)】
高速同近義詞替換、多詞隨機(jī)替換、段落隨機(jī)排序,助力內(nèi)容SEO
6、【無限多級(jí)頁(yè)面采集】
從支持多級(jí)目錄開始,無論是垂直方向多層信息頁(yè)面,還是平行方向復(fù)數(shù)內(nèi)容分頁(yè),抑或AJAX調(diào)用頁(yè)面,為你輕松采集
7、【自由擴(kuò)展】
開放的接口模式,可以自由二次開發(fā),自定義任何功能,實(shí)現(xiàn)所有需求
軟件功能
1、設(shè)定好方案,即可24小時(shí)自動(dòng)工作,不再需要人工干涉2、與網(wǎng)站分離,通過獨(dú)立制作的接口,可以支持任何網(wǎng)站或數(shù)據(jù)庫(kù)
3、靈活強(qiáng)大的采集規(guī)則不僅僅是采集文章,可采集任何類型信息
4、小巧、低耗和良好的穩(wěn)定性非常適合運(yùn)行于服務(wù)器
5、所有規(guī)則都可以導(dǎo)入導(dǎo)出,靈活的資
6、采用FTP上傳文件,穩(wěn)定、安全
7、下載上傳支持?jǐn)帱c(diǎn)續(xù)傳
8、高速偽原創(chuàng)
9、可選擇倒序、順序、隨機(jī)采集文章
10、支持自動(dòng)列表網(wǎng)址
11、支持對(duì)數(shù)據(jù)分布在多層頁(yè)面的網(wǎng)站進(jìn)行采集
12、自由設(shè)定采集數(shù)據(jù)項(xiàng),并可單獨(dú)過濾整理每個(gè)數(shù)據(jù)項(xiàng)
13、支持分頁(yè)內(nèi)容采集
14、支持任意格式、類型的文件(包括圖片、視頻)下載
15、可突破防盜鏈文件
16、支持動(dòng)態(tài)文件網(wǎng)址分析
17、支持對(duì)需登錄訪問的網(wǎng)頁(yè)的采集
18、可設(shè)定關(guān)鍵詞采集
19、可設(shè)定防止采集的敏感詞
20、可設(shè)置圖片水印
21、支持發(fā)布帶回復(fù)的文章,可廣泛用于論壇、博客等項(xiàng)目
22、與采集數(shù)據(jù)分離的發(fā)布參數(shù)項(xiàng),可自由對(duì)應(yīng)采集數(shù)據(jù)或預(yù)設(shè)數(shù)值,極大增強(qiáng)發(fā)布規(guī)則的重用性
23、支持隨機(jī)選用發(fā)布賬號(hào)
24、支持任意發(fā)布項(xiàng)語(yǔ)言翻譯
25、支持編碼轉(zhuǎn)換、支持UBB代碼
26、文件上傳可選擇好自動(dòng)建立年月日子目錄
27、模擬發(fā)布支持對(duì)無法安裝接口的網(wǎng)站進(jìn)行發(fā)布操作
28、方案可定時(shí)工作
29、防止網(wǎng)絡(luò)運(yùn)營(yíng)商劫持HTTP功能
30、可手動(dòng)進(jìn)行單項(xiàng)采集發(fā)布
31、詳盡的工作流程監(jiān)視、信息反饋,讓您迅速了解工作狀態(tài)
EditorTools2(全自動(dòng)采集器)使用說明
一、【使用登記】1、通過登記,獲得ET的使用授權(quán);
打開 主菜單-授權(quán)登記 ,填寫您在ET官方網(wǎng)站(非論壇)注冊(cè)的有效帳號(hào),進(jìn)行使用登記,即可獲得ET的使用授權(quán)
二、【系統(tǒng)設(shè)置】
打開 主菜單-系統(tǒng)-基本設(shè)置 ,進(jìn)行各種系統(tǒng)設(shè)置,見圖示
1、設(shè)置工作參數(shù);
根據(jù)您的需要設(shè)置工作參數(shù),見圖示
①、開機(jī)自動(dòng)運(yùn)行ET:?jiǎn)?dòng)電腦進(jìn)入系統(tǒng)后,自動(dòng)運(yùn)行ET程序;
②、ET啟動(dòng)后自動(dòng)工作:ET啟動(dòng)運(yùn)行后,自動(dòng)執(zhí)行上一次使用ET時(shí)勾選的工作方案,只有啟用本項(xiàng),才會(huì)自動(dòng)保存當(dāng)前勾選的工作方案;
③、啟動(dòng)后最小化:ET啟動(dòng)后,隱藏主窗口,只顯示托盤圖標(biāo);
④、忽略規(guī)則首尾空白:?jiǎn)⒂帽卷?xiàng)后,采集配置中的各個(gè)規(guī)則將自動(dòng)去除首尾的空格、回車、換行等空白字符,以避免用戶多輸入空格或換行導(dǎo)致規(guī)則分析失??;如果用戶需要利⑤、用空格或換行來確定規(guī)則的首尾邊界,則請(qǐng)取消勾選;
⑥、方案執(zhí)行間隔時(shí)間:在進(jìn)行自動(dòng)工作、選擇多個(gè)方案時(shí),一個(gè)方案的當(dāng)前列表采集完后,間隔多久更換采集下一個(gè)方案;
⑦、訪問網(wǎng)絡(luò)超時(shí)時(shí)間:設(shè)定在訪問網(wǎng)絡(luò)時(shí)超過多久無響應(yīng)則強(qiáng)制斷開;
⑧、訪問網(wǎng)絡(luò)重試次數(shù):設(shè)定在訪問網(wǎng)絡(luò)時(shí)遇到失敗的自動(dòng)重試次數(shù),例如采集網(wǎng)頁(yè)、下載文件、FTP上傳等;
⑨、訪問網(wǎng)頁(yè)失敗后自動(dòng)重啟ET:設(shè)定在訪問網(wǎng)頁(yè)失敗一定次數(shù)后自動(dòng)重啟ET,以解決一些可能出現(xiàn)網(wǎng)絡(luò)阻塞導(dǎo)致無法繼續(xù)正常工作的問題;本功能僅在自動(dòng)工作時(shí)生效,停止自動(dòng)工作將重置失敗計(jì)數(shù),重試訪問不計(jì)數(shù);
2、設(shè)置代理
如果您通過代理上網(wǎng),請(qǐng)?jiān)O(shè)置訪問網(wǎng)頁(yè)的代理參數(shù),見圖示
僅用于采集:勾選本項(xiàng),將會(huì)使代理設(shè)置僅在采集網(wǎng)頁(yè)時(shí)生效,發(fā)布時(shí)不使用代理,這是2.3.8版中新增功能
3、設(shè)置劫持特征代碼
很多地區(qū)的電信寬帶用戶在上網(wǎng)時(shí),會(huì)被強(qiáng)行在訪問信息中,用一些代碼替換訪問信息,讓用戶只能通過代碼中的框架查看原本要訪問的網(wǎng)頁(yè),這通常用來顯示電信的廣告或進(jìn)行其他隱秘的動(dòng)作,這種行為被稱為劫持瀏覽器;當(dāng)出現(xiàn)這種情況時(shí),ET所采集的源碼也只能得到這些劫持代碼,而不是要采集的網(wǎng)頁(yè)源碼。通過設(shè)置這些劫持代碼的特征字符串,ET會(huì)嘗試突破劫持訪問真實(shí)的網(wǎng)頁(yè)源碼,最多可以重試5次訪問該網(wǎng)址
4、設(shè)置UserAgent
網(wǎng)站通過userAgent來判斷當(dāng)前用戶使用的是什么瀏覽器,并根據(jù)這個(gè)瀏覽器能夠支持的情況提供相應(yīng)的功能。瀏覽器在訪問一個(gè)網(wǎng)頁(yè)時(shí)通常會(huì)傳送一個(gè)識(shí)別字串告訴網(wǎng)站它是什么瀏覽器軟件,我們?cè)L問的部分網(wǎng)站會(huì)對(duì)UserAgent進(jìn)行限制,我們可以在基本設(shè)置中修改UserAgent,也可以點(diǎn)擊'獲取本機(jī)UserAgent'按鈕獲得本機(jī)的IE默認(rèn)UserAgent
5、設(shè)置支持語(yǔ)言
采集某些網(wǎng)頁(yè)時(shí),網(wǎng)站可能會(huì)檢查支持的語(yǔ)言,用戶可以在此調(diào)整。
6、鎖定設(shè)置
打開 主菜單-系統(tǒng)-鎖定設(shè)置 ,見圖示:
此功能用于設(shè)置打開各個(gè)配置窗口時(shí)的密碼,當(dāng)設(shè)置了鎖定密碼后,使用 菜單-鎖定 功能,即可在用戶離開電腦后,防止他人訪問操作各項(xiàng)配置
三、【前臺(tái)使用操作】
1、【選擇工作方案】
工作方案包含了從來源獲取原始信息、信息加工處理、最終發(fā)布到目標(biāo)網(wǎng)站一系列工作的全部設(shè)定指令,是ET進(jìn)行自動(dòng)采集工作的指揮官,當(dāng)制定好我們需要的方案后(方案制訂見 用戶手冊(cè) - 設(shè)置篇),即可在主窗口選擇工作方案,開始采集工作。
①、認(rèn)識(shí)方案區(qū);
主窗口左側(cè)上方的樹形目錄區(qū)即為方案區(qū),點(diǎn)擊鼠標(biāo)右鍵,彈出操作菜單
②、勾選方案;
點(diǎn)擊方案名前的選擇框,選中將要執(zhí)行的方案,可以多選,
如果所選方案缺少關(guān)鍵性配置,將顯示提示,并將取消選中
ET工作時(shí),將首先從當(dāng)前的焦點(diǎn)方案開始執(zhí)行,即藍(lán)色反亮顯示的方案,見圖示4中的‘網(wǎng)站-discuz 6.0(帶回復(fù))’
選中的多個(gè)方案,將循環(huán)執(zhí)行。
在主窗口右側(cè)上方的文章列表區(qū),將顯示勾選的焦點(diǎn)方案的待處理文章。
在方案名稱上點(diǎn)右鍵,彈出菜單見圖示
點(diǎn)編輯方案,會(huì)進(jìn)入該方案編輯窗口
雙擊方案名稱,也可以直接進(jìn)入該方案編輯窗口。
2、自動(dòng)工作
選擇好將要執(zhí)行的工作方案后,點(diǎn)擊主窗口左側(cè)下方的‘自動(dòng)’按鈕,即可開始全自動(dòng)工作,用戶從此時(shí)起可以扔掉鼠標(biāo)鍵盤、拋開繁累的網(wǎng)站更新,與朋友結(jié)伴出游,網(wǎng)站內(nèi)容自有ET為您默默收集更新,要停止自動(dòng)工作,請(qǐng)點(diǎn)擊‘停止’按鈕;
ET支持命令行啟動(dòng),參數(shù) /auto 可啟動(dòng)自動(dòng)工作,命令行使用示例:d:\editortools.exe /auto
3、手動(dòng)工作
在進(jìn)行方案調(diào)試時(shí),通常會(huì)使用手動(dòng)方式進(jìn)行采集操作。
①、采集目錄;
點(diǎn)擊主窗口左側(cè)下方的‘采集目錄’按鈕,ET將對(duì)當(dāng)前選中的焦點(diǎn)方案執(zhí)行目錄采集動(dòng)作,若無焦點(diǎn)方案則按順序執(zhí)行
采集到的目錄信息則顯示在主窗口右側(cè)上方的文章列表區(qū),
注意:當(dāng)方案的采集規(guī)則有修改時(shí),會(huì)自動(dòng)清空未發(fā)布文章,包括發(fā)送失敗的文章,以避免用戶繼續(xù)使用錯(cuò)誤的文章條目來采集
②、處理文章;
當(dāng)文章列表區(qū)中有待處理文章時(shí),點(diǎn)擊主窗口左側(cè)下方的‘處理文章’按鈕,將按順序?qū)ξ恼铝斜韰^(qū)的第一項(xiàng)待處理文章執(zhí)行采集動(dòng)作
文章處理過程中,在主窗口右側(cè)下方的信息區(qū),將顯示工作記錄,
處理結(jié)束后,文章列表區(qū)的對(duì)應(yīng)條目將顯示處理的狀態(tài)
③、另一種手動(dòng)處理文章方式
在文章列表區(qū),雙擊某項(xiàng)文章條目,將對(duì)該篇文章執(zhí)行采集動(dòng)作,無論這篇文章是否已經(jīng)被處理。
4、認(rèn)識(shí)文章列表區(qū)
主窗口右側(cè)上方的表格區(qū)域,即是文章列表區(qū),這里顯示所執(zhí)行方案的待處理文章,
①、文章列表區(qū)各列說明;
文章采集標(biāo)題:這是通過采集規(guī)則-列表分析規(guī)則獲取的文章標(biāo)題,如果該采集規(guī)則未再設(shè)置標(biāo)題數(shù)據(jù)項(xiàng)的分析規(guī)則,那么ET將使用此處的文章采集標(biāo)題作為發(fā)布標(biāo)題,文章采集標(biāo)題可更改,點(diǎn)擊標(biāo)題后的省略號(hào)按鈕 可進(jìn)入編輯狀態(tài)
狀態(tài)-發(fā)送:當(dāng)該項(xiàng)值為YES時(shí),表示該篇文章已成功發(fā)布
狀態(tài)-敏感:當(dāng)該項(xiàng)值為YES時(shí),表示該篇文章正文包含敏感關(guān)鍵詞
狀態(tài)-錯(cuò)誤:0表示無錯(cuò)誤,其他錯(cuò)誤代碼含義請(qǐng)參考相關(guān)主題
狀態(tài)-處理:打勾的文章條目表示已經(jīng)執(zhí)行過,您可以通過點(diǎn)擊取消勾選,使它被再次執(zhí)行
②、轉(zhuǎn)換顯示編碼
在文章列表區(qū)上點(diǎn)右鍵,將彈出編碼菜單
③、雙擊執(zhí)行文章采集;
在上一部分已經(jīng)講過,可以在文章列表區(qū),雙擊某篇文章條目,以執(zhí)行對(duì)它的采集;
④、瀏覽按鈕
點(diǎn)擊文章條目的瀏覽按鈕,可以訪問該篇文章網(wǎng)址,用于確認(rèn)網(wǎng)址是否正確、查看網(wǎng)頁(yè)源代碼等
5、認(rèn)識(shí)信息欄
信息欄用于跟蹤執(zhí)行過程、反饋各種信息,是了解ET工作情況、解決采集所遇問題的重要工具,
①、工作記錄:
該欄記錄ET的每一步工作過程及狀態(tài),包括目錄采集和文章處理兩大部分,我們通過工作記錄可以了解該次采集執(zhí)行是否正確完成,或是出現(xiàn)了什么問題;當(dāng)出現(xiàn)問題時(shí),可以根據(jù)提示、結(jié)合信息欄的其他反饋內(nèi)容,用戶可以迅速準(zhǔn)確地找到故障原因并予解決。
②、采集源碼:
此欄顯示執(zhí)行過程中所采集的文章列表頁(yè)、文章頁(yè)面、文章分頁(yè)等的網(wǎng)頁(yè)源代碼,利用此欄源代碼,可以方便的進(jìn)行規(guī)則測(cè)試、提供規(guī)則定制依據(jù)。
注意,某些網(wǎng)站會(huì)根據(jù)不同來訪瀏覽器而顯示不同的源代碼,所以,ET的采集規(guī)則定制時(shí),應(yīng)以此欄的源代碼為準(zhǔn),例如采集規(guī)則范例中的‘SMF 1.1.5’,其網(wǎng)站通過IE訪問和ET采集獲取到的源碼就有區(qū)別。
③、分析數(shù)據(jù):
此欄顯示文章處理過程中的各個(gè)數(shù)據(jù)項(xiàng)信息,從分析到的原始代碼,到整理后的代碼,再到經(jīng)過URL修正后的代碼,用戶通過查看此欄,可以了解設(shè)置的數(shù)據(jù)項(xiàng)分析規(guī)則是否準(zhǔn)確、整理組規(guī)則是否完善、最終的信息是否符合自己的要求。
例如:當(dāng)工作記錄欄提示錯(cuò)誤‘正文字?jǐn)?shù)大于或小于發(fā)布設(shè)置’時(shí),我們可以查看本欄的‘正文’數(shù)據(jù)項(xiàng),了解具體是大于還是小于發(fā)布設(shè)置,原因是正常還是因?yàn)檎斫M設(shè)置不當(dāng),從而調(diào)整各個(gè)設(shè)置。
④、發(fā)送代碼
此欄顯示ET向發(fā)布網(wǎng)站發(fā)送的數(shù)據(jù),包括文章檢查部分和文章發(fā)布部分;
用戶可以通過此欄信息了解通過一系列分析、整理操作,最終向發(fā)布網(wǎng)站提交的數(shù)據(jù),用以檢查自己的采集規(guī)則數(shù)據(jù)項(xiàng)、發(fā)布規(guī)則的參數(shù)設(shè)置等是否正確、完整。
⑤、返回信息
此欄顯示ET向發(fā)布網(wǎng)站發(fā)送數(shù)據(jù)后發(fā)布網(wǎng)站的反饋,包括文章檢查反饋和文章發(fā)布反饋;
通過查看此欄,我們可以清晰的了解當(dāng)采集過程出現(xiàn)問題時(shí)的大部分原因。
一些接口在返回錯(cuò)誤信息時(shí),信息可能是HTML代碼,不熟悉HTML代碼的用戶閱讀比較吃力,點(diǎn)擊WEB瀏覽按鈕,可以在操作系統(tǒng)默認(rèn)瀏覽器中方便的查看它們
運(yùn)行要求
1、【操作系統(tǒng)要求】EditorTools 為win32軟件,可以運(yùn)行于 微軟簡(jiǎn)體中文版 Windows xp/2000/2003/2008/vista/win7 等操作系統(tǒng)環(huán)境下。我們已在軟件中針對(duì)上述操作系統(tǒng)做了大量的測(cè)試和實(shí)地檢驗(yàn),保證 EditorTools 可以在上述系統(tǒng)中安全穩(wěn)定的運(yùn)行。
如果您選擇在非簡(jiǎn)體中文的windows操作系統(tǒng)下運(yùn)行ET,那么可能會(huì)遇到界面顯示亂碼等情況,具體需要您自行測(cè)試,通??梢酝ㄟ^安裝標(biāo)準(zhǔn)簡(jiǎn)體中文字庫(kù)(GB2312)解決。
2、【支撐環(huán)境要求】
EditorTools2需要計(jì)算機(jī)具備如下軟件環(huán)境
mdac 2.8或以上版本 (ADO數(shù)據(jù)庫(kù)驅(qū)動(dòng))
已注冊(cè)的scrrun.dll (用于閱讀和編寫腳本和文本文件)
已注冊(cè)的vbscript.dll (VBScript腳本相關(guān)支持文件)
其他版本
下載地址
- 電腦版
EditorTools2(全自動(dòng)采集器) v2.7官方版
- 本地下載通道:
- 浙江電信下載
- 北京聯(lián)通下載
- 江蘇電信下載
- 廣東電信下載
猜您喜歡
- 電腦數(shù)據(jù)采集軟件
- 工作中大家可能會(huì)用到一些數(shù)據(jù),而苦于沒有好的數(shù)據(jù)采集軟件,只能一個(gè)一個(gè)的去網(wǎng)站采集。數(shù)據(jù)采集,又稱數(shù)據(jù)獲取,是利用一種裝置,從系統(tǒng)外部采集數(shù)據(jù)并輸入到系統(tǒng)內(nèi)部的一個(gè)接口。數(shù)據(jù)采集技術(shù)目前廣泛應(yīng)用于各個(gè)領(lǐng)域。針對(duì)制造業(yè)企業(yè)的龐大生產(chǎn)數(shù)據(jù),數(shù)據(jù)采集工具尤為重要。那么市場(chǎng)上數(shù)據(jù)采集工具有哪些?3322小編整理了一批好用的數(shù)據(jù)采集軟件,安裝后可以輕松的采集到你想要的數(shù)據(jù),還不趕快下載安裝。
-
火車頭采集器官方版 v10.24正式版 網(wǎng)絡(luò)輔助 / 53.96M
-
爬山虎采集器官方版 v3.1.0.0 網(wǎng)絡(luò)輔助 / 61.81M
-
后羿采集器 v4.0.2官方版 網(wǎng)絡(luò)輔助 / 81.78M
-
懶人采集器(網(wǎng)頁(yè)資源采集工具)官方版 v3.2.9.1 網(wǎng)絡(luò)輔助 / 85.66M
-
八爪魚采集器官方版(免費(fèi)網(wǎng)絡(luò)爬蟲軟件) v8.6.7 網(wǎng)絡(luò)輔助 / 79.69M
同類軟件
網(wǎng)友評(píng)論
共0條評(píng)論(您的評(píng)論需要經(jīng)過審核才能顯示)