Hướng dẫn lấy bài tự động

Với tài khoản GÓI PRO bạn có thể thực hiện chức năng lấy tin tự động.

1. Thêm website muốn lấy tin

– Đầu tiên trước khi lấy tin tự động chúng ta cần vào quản lý nguồn nội dung thêm website mà bạn muốn lấy tin:

– Sau đó nhấn thêm để thêm wesbite:

– Sau khi form thêm website hiện ra. Các bạn điền các thông tin giúp chúng ta có thể lấy tin từ website đó:

  • Website: là địa chỉ website mà bạn muốn lấy tin chú ý điền dạng đầy đủ http, và không có / ở cuối.Ví dụ: http://giadinh.vnexpress.net
  • Chiến dịch : chọn chiến dịch mà dùng website này lấy tin
  • Group: Là khối chứa danh sách bài viết.(Khối bao đỏ được dánh dấu trong hình)

Để chọn khối này chúng ta cần sự hỗ trợ của fire bug .Tiện ích này được hỗ trợ trên cả google chrome và fire fox. Nhưng theo mình thì dùng fire fox sẽ tiện hơn.Các bạn cài đặt addon này tại đây:

https://addons.mozilla.org/vi/firefox/addon/firebug/

https://getfirebug.com/firebuglite

Sau khi cài đặt chúng ra chùng firebug để xác định thẻ html chứa danh sách tin tức mà chúng ta muốn lấy:

Chú ý: Quý tắc chọn thẻ html:

Chọn thẻ có id: (tên thẻ)#(Tên ID) ví dụ ul#news_home

với thẻ class : (tên thẻ).(Tên class) ví dụ: ul.list_news

Trong trường hợp của vnexpress chúng ta lấy : ul#news_home , hoặc ul.list_news đều được

  • Item: Là khối chứa bài viết.

Chúng ta dùng fire bug để tìm thẻ html chứa bài viết: nếu thẻ tìm được không có class hay id chúng ta chọn tên thẻ thôi cũng được: trường hợp này chúng ta chọn thẻ li

  • Sau khi chọn khối bài viết chúng ta chọn liên kết đến bài viết:cũng dùng fire bug để chọn: trường hợp này là a.txt_link

  • Tên bài viết: Chúng ta click vào link bài viết và tiếp tục chọn khối chứa tên bài viết. Trường hợp này chúng ta chọn là h1 vì (Website thường chỉ có 1 h1 nên chọn h1 cũng được) . Để chắc chắn hơn chúng ta chọn thêm thẻ cha : div.title_news h1 thì phần mềm sẽ xác định chính xác hơn tên bài viết.

 

  • Nội dung bài viết: khối chứa nội dung của bài viết xác định tương tự như các phần trên và xác định được :div.main_content_detail
  • Xóa theo khối: Trong nội dung bài viết có thể xuất hiện những khối chứa nội dung quảng cáo, hay là like chia sẻ mạng xã hội chúng ta không muốn lấy thì có thể điền các thẻ html chứa khối này tại đây.Mỗi khối cách nhau bởi 1 dấu |. Ví dụ với trường hợp này: table.tbl_insert|script|div.relative_new|div.title_news|div.div-fbook|div.block_timer_share|div.block_chiase_480|div.social_like|div.box_tinlienquan|div.banner_common|div.block_col_160|div.box_tinkhac_detail|div.box_category|div.block_tag|div.box_comment|div.box_tinkhac_detail|div#box_tinlienquan|div#box_comment
  • Xóa theo từ khóa: Một số trường hợp nội dung bài chứa số phone hoặc từ khóa nào đó mà chúng ta không muốn hiển thị trong bài chúng ta có thể xóa nó đi với lệnh:từ khóa= từ khóa mới ví dụ: [email protected][email protected]. Muốn xóa nhiều từ khóa thì từ khóa= từ khóa mới | từ khóa1= từ khóa mới1 

Sau khi cấu hình xong thông tin chúng ta nhấn thêm.

Giờ chúng ta có thể lấy bài viết cho chiến dịch của mình.

2.Lấy bài viết cho chiến dịch

Vào chiến dịch cần lấy tin -> quản lý bài viết : danh sách chức năng lấy tin hiện ra:

Phần mềm hỗ trợ lấy tin theo các dạng:

– Lấy tin theo danh sách( hỗ trợ dịch nếu website tiếng anh): chỉ dùng để test

– Lấy tin theo bài viết lẻ( hỗ trợ dịch nếu website tiếng anh)

– Hẹn giờ lấy tin( với 1 số trang có tính bảo mật cao chúng ta không thể lấy tin liên tục được mà phải hẹn giờ, việc lấy liên tục sẽ bị website đó khóa không thể lấy)

 

Hẹn giờ lấy tin:

CHÚC CÁC BẠN LẤY TIN THÀNH CÔNG

Xem th�m t?i:Hướng dẫn lấy bài tự động

Scroll