關於文章來源部份的輸入圖示說明:

a

1.從電腦資料夾中獲取文章
2.按關鍵字從網路上收集文章
3.從指定的網站上收集文章
4.從軟體收集的商品文中獲取文章


1.從電腦資料夾中獲取文章:
例:在f碟創建一個資料夾,隨便取個名字,比如 我的文章,即: f:\我的文章(看下圖)。文章來源填入 f:\我的文章 即可。
這樣他會自動從
f:\我的文章這個資料夾中獲取裏面的任意一個txt和htm檔,將檔名作為文章的標題,檔的內容作為文章內容(檔內容支援使用html語法),發到blog上去。
同一個blog,發過的,不會重複發,可以一次放多個檔,在處理時,隨時可在這個資料夾中刪除和新增檔。 (如圖:)

a  a

2.按關鍵字從網路上收集文章:

點擊關鍵字,填入一個關鍵字,再點插入,如下圖。
注:(插入成功后,可更改關鍵字或搜尋引擎等后,再點插入,可以一直插入新的來源)
如圖:

最終效果

3.從指定的網站上收集文章:

點擊“部落格/新聞/網站”,填入一個網址,再點插入。如下圖:
注:(插入成功后,可更改網址后,再點插入,可以一直插入新的來源)
如果是已知網站,則會自動識別頭尾標誌。
如果不是已知網站,則可以參考下面的進階附錄, 自已找頭尾標誌填入。
如果看了后,仍然不會找,也可只填網址,由軟體自動識別網站內的文章,但識別結果可能不精准。

最終效果

4.從軟體收集的商品文中獲取文章:

抓商品文的詳細說明,點此查看。

請注意:文章來源中可填入多行,並且可以是這4種來源的混合,如圖:
最終效果

=====================================================================================================================================

進階附錄:找網站中文章的頭尾標誌。

(從其它您自己想要指定的網站抓文章的設定方法,如無此需要,不需要看以下進階附錄)

從網路上抓文章需要告訴軟體三個參數,下面舉例說明需哪三個(請按照例子學習)。
1.第一個參數是告訴軟體,你要從哪個網址抓文章。
注:指定的這個網址必須是一個文章目錄,而不是某篇具體的文章。
如:http://news.sina.com.tw/ents/ 是一個正確的網址,因裏面含有大量文章的連接。

2.現在從這個網址中隨便點擊一篇文章,打開該文章的網址。
如:http://news.sina.com.tw/article/20140112/11563483.html

3.打開文章網址後,您會發現該網址除了文章外,還有很多廣告等雜七雜八的訊息,肯定是您不想發表出來的。
所以此時您要告訴軟體,您需要抓的內容,是該文章中的哪一部分,即要抓的內容是從哪裏開始(頭標誌)到哪裏結束(尾標志)
在這裏,從哪裏開始是第2個參數,到哪裏結束是第3個參數

4.第2個和第3個參數,必須通過檢視文章網頁的原始檔來獲得。(下面有圖示說明)
通過以下步驟可精准獲得這2個參數(下面有圖示說明)
第一步:在網頁上點右鍵,點“檢視原始檔”。
第二步:從源始碼中,先找到您需要抓的內容塊。再往前一點,找一組字符,作為參數2,表示要從該處開始抓內容。
在本例中,我們找到的參數2是->name="iclickAdBody_Start"
第三步:往後拉,找到您要抓的內容的結束部分,也找一組字符,作為參數3,表示只抓到該處。
在本例中,我們找到的參數3是->iclickAdBody_End

5.原始碼中這麼多字串,為什麼要用name="iclickAdBody_Start" 作為參數2呢?
原因1:name="iclickAdBody_Start" 在整個源始碼中只有一處地方有。如果您用<p>這樣的字串,因為原始碼中太多<p>,很可能會抓到其它內容去了。
原因2:name="iclickAdBody_Start" 在目錄網址http://news.sina.com.tw/ents/ 中的所有文章的原始碼中都是有的,您可隨便另點一篇其它文章進入,檢視原始檔,應該也會看到有name="iclickAdBody_Start"

6.為什麼要用iclickAdBody_End作為參數3呢?
原因1:因為iclickAdBody_End在要抓的內容的結尾處。
原因2:在網址http://news.sina.com.tw/ents/ 這個目錄下的所有文章的原始碼中,iclickAdBody_End都恰好在要抓的內容的結尾處。

參數2,3的設置說明圖

參數2,3的說明

所以,現在軟體需要的三個參數都知道了
參數1:
要從哪個網址收集?(該參數填入 網址 中)
參數2:
要從文章原始碼中的哪里開始抓?(該參數填入 頭標志 中)
參數3:
要抓到哪里結束?(該參數填入 尾標志 中)


我們看下本例的最終填入的圖:
最終效果

至此,已經可以抓到文章了,但為了提高收集文章的速度,還可以再告訴軟體一些資訊,會收集得更快。
當然,以下資訊並不是必須要填的,如果有興趣可以繼續看看

現在再回到 文章目錄網址: http://news.sina.com.tw/ents/
我們看到該網址中,除了文章有連接外,還有其它一些廣告等也有連接。
為了讓軟體抓文章連接時,不要去抓那些廣告的連接,可以找出文章連接的共同點,告訴軟體。
在本例中,我們很容易可以發現,想要收集的文章的連接都會含有article這個字串(如:http://news.sina.com.tw/article/20140112/11563483.html) 這樣,所以我們在 標題和連接必須含 中填入:article 即可