国产男女自拍-国产黄频免费高清视频-五月婷婷视频-欧美一区二区三区久久综合-亚洲天堂最新-成人无码精品一区二区三区-国内成+人 亚洲+欧美+综合在线-粉嫩虎白女毛片人体-天天摸天天干天天操-淫羞阁av导航-精品乱码无人区一区二区-男人天堂亚洲天堂-伊人网影院-超91在线-播放黄色一级片-久久艹精品视频-日本三级欧美三级人妇视频黑白配-久久久久久久久久久久久久久久久久久久-丰满少妇偷人51视频在线观看-欧美黄色短视频

網址導航網站采集發布教程

簡數采集器可自動采集導航網站的網址鏈接(如AI導航站、軟件資源站等),并發布到指定網站。

導航站網址采集發布基本流程:定位網頁中的網址位置 -> 配置網址采集規則 -> 采集發布網站。

1. 定位網頁中的鏈接地址

查找要采集的鏈接地址在網頁中的具體位置,并使用XPath語法定位提取。查找鏈接方法主要有兩種:右鍵快速查找和源代碼精準查找。

1)右鍵快速查找

在瀏覽器打開目標頁面,對包含網址的區域,鼠標右鍵選擇 "檢查" ,可快速查看對應的HTML代碼。


當網址為<a>標簽的href屬性時,可直接使用簡數【獲取網址】功能一鍵提取。

若代碼中未發現目標網址(如上圖示例中的 "鏈接直達"),建議打開網頁完整源代碼進行搜索。


2)源代碼精準查找

在網頁源代碼中查找目標網址,是更全面且準確的方法。

I. 查看源代碼

瀏覽器打開目標頁面,在網頁空白處(無文本與圖片),鼠標右鍵選擇 "查看網頁源代碼" 。

源代碼查看方式二:在瀏覽器地址欄輸入 view-source:https://www.網站.com/


II. 精準搜索

在網頁源代碼頁面,快捷鍵 Ctrl + F 打開搜索框,輸入目標網址(如 trae.com),可精準定位所有匹配網址的具體位置。


如示例圖,目標網址在 class="btn btn-arrow qr-img" 類的標簽 title 屬性值中。


2. 配置網址采集規則

網址采集配置方法主要有兩種:提取標簽屬性值(如<a>標簽的href,data-url屬性),和抓取跳轉子頁面的內容。

1)提取標簽屬性中的網址

打開簡數詳情提取器,填寫對應字段Xpath值(沿用前面示例,值應為//*[@class="btn btn-arrow qr-img"]) -> 字段數據處理 -> 高級提取 -> 提取值類型選擇【節點屬性】 -> 屬性名填寫title。

補充說明:>>> Xpath語法使用教程(重點為第4和5節)



若屬性值里除了目標網址,還包含多余內容,可使用替換刪除或正則截取功能只保留網址。

示例獲取屬性值為 https://www.網址.com/qr/?text=https://www.trae.com.cn/?utm_source=advertising&#038;utm_medium=....

此例建議使用正則截取功能提取網址:在字段數據處理【常用截取|提取】,正則捕獲組處填寫相應的正則表達式:

text=(.+?)\?

說明:此表達式是截取text=和?字符之間的內容,(.+?)為固定語法,問號字符需加反斜杠轉義。


完成提取標簽屬性中的網址配置后,發送操作請參見下方【第3章 發送導航網站】


2)采集跳轉頁面中的網址

如果目標網址未直接出現在網頁源代碼中,需通過點擊a標簽跳轉至子頁面后獲取,可使用內容多分頁功能實現抓取。操作示例如下:


I)跳轉鏈接采集

在簡數詳情提取器,點擊對應字段  -> 勾選【該字段內容有多分頁】 -> 點擊分頁采集開關 -> 【分頁區域Xpath】欄填寫對應詳情頁跳轉鏈接a標簽的Xpath值。(例子為//*[@class="site-go-url"]/a[1])

補充說明:>>> Xpath語法使用教程(重點為第4和5節)



II)跳轉頁面采集配置

在瀏覽器打開跳轉子頁面,查找目標網址。


因跳轉頁面停留時間過短,建議通過查找網頁源代碼定位目標網址,在瀏覽器地址欄直接輸入:

view-source:https://網站.com/go/?url=aHR0c....



在簡數詳情提取器,【當前字段Xpath】填寫對應目標網址的Xpath值(例子為//*[@class="loading-btn"]) -> 字段數據處理 -> 高級提取 -> 提取值類型選擇【節點屬性】 -> 屬性名填寫href -> 保存,測試采集查看結果。



III)采集結果


3. 發送導航網站

簡數采集器支持自動發送網址數據到導航網站,比如Wordpress的OneNav 主題(一為主題)。

1)安裝發布插件

下載并安裝 Wordpress采集發送插件(兼容OneNav主題)

2)添加并配置發送目標

在【發送目標管理】頁面,添加相應CMS系統的發送目標,例如添加發送目標WordPress。



第二步配置映射字段處,"post類型" 選擇sites -> 第三步添加擴展參數,參數名填寫_sites_link(網址鏈接)和 _sites_sescribe(簡介),并映射采集網址的字段。


一為主題其他可選參數:_seo_title(seo標題)、_seo_metakey(seo關鍵詞)、_seo_desc(seo描述)等;


3)發送數據

在簡數采集結果數據,將網址數據批量發送到導航網站。