Back to Question Center
0

Tutorial Scraper Web Chrome Dari Semalt Expert

1 answers:
Jika Anda menggunakan Google Chrome, ada ekstensi untuk browser Anda

yang bisa membantu mengikis halaman web. Ini dikenal sebagai '' Scrapper, '' dan bisa dimanfaatkan tanpa masalah. Scrapper akan membantu menghapus konten situs web dan mengunggah hasilnya ke dokumen Google.

Bagaimana memo situs web menggunakan ekstensi Scraper?

1. Pilih Toko Web Chrome di Google Chrome;

2. Dalam ekstensi, lakukan pencarian untuk '' Scrapper '';

3. Hasil pencarian pertama adalah ekstensi yang dikenal sebagai '' Scrapper '';

4. Pilih tombol yang terdaftar sebagai '' Add to Chrome ';

5. Kembali ke daftar anggota parlemen Inggris;

6. Klik yang berikut 7. Sekarang cari satu MP dan pastikan entri ditandai;

8. Klik kanan untuk memilih "Scrape" ;

Mirip dengan "pilihan;

9. Konsol untuk scrapper akan muncul di jendela lain;

10. Melihat konten tergores di scraperper konsol,

11. Untuk memastikan konten disimpan sebagai Google Spreadsheet, pilih "Simpan ke Google Dokumen ..."

Diperpanjang mengikis

Sebelum menempel pada resep ini , ini berguna untuk memahami dasar-dasar HTML Misalnya, Anda bisa membaca pengantar singkat tentang HTML melalui tautan ini

Mari kita bayangkan kita tertarik dengan semua film yang membintangi Asia Argento, seorang aktris Italia yang terkenal.

1. Ada arsip aktor yang sangat rinci di IMDB. Situs Asia Argento adalah: https://www.imdb.com/name/nm0000782/;

2. Di sini, Anda bisa melihat semua peran yang dimainkan oleh aktris..Mari mulai menghapus informasi yang kami minati;

3. Cobalah mengikisnya seperti yang dijelaskan di atas;

4. Anda akan melihat bahwa daftarnya sedikit terdistorsi. Hal ini disebabkan oleh fakta bahwa daftar di sini dapat disusun secara berbeda;

5. Kepala ke konsol pengikis. Kiri atas, Anda akan melihat kotak kecil yang mengatakan XPath;

6. Xpath adalah semacam bahasa query yang bekerja untuk XML dan HTML;

7. XPath dapat membantu untuk menemukan bagian-bagian dari halaman yang Anda minati. Hal berikutnya adalah menemukan elemen yang sesuai dan tuliskan XPath untuk itu;

8. Sekarang mari kita atur meja kita;

9. Anda akan melihat bahwa XPath kita ada, yang memiliki semua data yang dibutuhkan adalah "// div [3] / div [3] / div [2] / div";

10. XPath menginformasikan Sistem untuk melihat dokumentasi HTML dan memilih elemen ketiga, lalu elemen kedua dan kemudian semuanya;

11. Tapi, kami ingin memisahkan data kami;

12. Manfaatkan bagian kolom di konsol untuk scrapper agar selesai;

13. Pertama-tama cari judul kami І Gunakan Elemen Periksa untuk melihat judulnya;

14. Periksa judul dalam tag. Tambahkan tag ke XPath;

15. Ekspresi tampak berfungsi dengan tepat, jadi jadikan kolom pertama kita;

16. Pada bagian "Kolom", ganti nama kolom pertama menjadi "judul";

17. Tambahkan XPath untuk itu;

18. Di bagian kolom, XPaths relatif dan itu berarti "./b" akan memilih elemen

19. Dalam XPath untuk kolom judul, tambahkan "./b" dan pilih "scrape";

20. Sekarang mari kita teruskan selama setahun. Tahun bisa ditemukan dalam satu rentang;

21. Buat kolom baru dengan memilih plus kecil di sebelah kolom untuk judul Anda;

22. Menggunakan XPath "./span" buat kolom untuk "tahun";

23. Klik gesekan dan lihat bagaimana tahun itu ditambahkan;

24. Selesai!

December 6, 2017
Tutorial Scraper Web Chrome Dari Semalt Expert
Reply