Yogyakarta, 2 September 2022
Program Magister Sains dan Doktor (MD) FEB UGM telah berhasil menyelenggarakan acara Thesis Coaching pada tanggal 2 September 2022. Thesis Coaching kali ini diwajibkan untuk seluruh mahasiswa Program Magister Sains yang sedang menempuh tesis. Acara ini dilaksanakan secara luring yang bertempat di Auditorium BRI Lantai 3 Program MD FEB UGM dengan menghadirkan Bapak Edi Winarko, M.Sc., Ph.D., Dosen Fakultas MIPA UGM. Pelatihan tesis kali ini mengangkat topik kekinian yaitu “Web Scraping” yang bertujuan untuk memberikan panduan kepada para mahasiswa mengenai pengolahan data yang bersumber dari web. Acara kali ini diikuti oleh mahasiswa Magister Sains Akuntansi, Sains Ilmu Ekonomi, dan Sains Manajemen.
Dalam kegiatan pelatihan ini, Bapak Edi Winarko memulai pemaparan dengan menjelaskan pentingnya teknik web scraping. Web scraping adalah cara mengunduh data dari halaman web yang mengandung data yang banyak sekali jenisnya, seperti artikel, lowongan pekerjaan, dll. Data tersebut ditampilkan sebagai halaman web (HTML) dan ditujukan untuk konsumsi oleh manusia. Berbagai data tersebut perlu diekstrak dari halaman web sebelum dapat diolah oleh program komputer. Dua metode dalam web scraping adalah memanfaatkan library (misalnya Python) dan Point & Click (no code), seperti Octoparse, Apify, dan ParseHub.
Kegunaan web scraping adalah untuk kepentingan industri/organisasi (rekrutmen tenaga kerja, marketing, e-commerce dan ritel) dan untuk kepentingan individu (data scientist, data journalist, peneliti, freelancer). Berdasarkan survei, web scraping sering digunakan konsumen dengan tujuan content scraping, research, contact scraping, price comparison, dan weather data monitoring.
Beliau memberikan pemahaman mengenai bagian dari software Octoparse. Bagian utamanya adalah Home screen dan Sidebar. Bagian atas Home screen tersebut ada Search bar untuk memasukkan halaman web yang akan di-scrap. Menu Sidebar memuat tombol New, Dashboard, dan Setting. Workspace digunakan untuk membangun scraper (task) yang dibagi menjadi lima bagian, seperti browser, tips, the workflow, setting, dan data previewer.
Dalam sesi selanjutnya, terdapat sesi pelatihan mengenai web scraping dengan software Octoparse. Hasil dari scraping tersebut bisa langsung diproses (export) atau disimpan terlebih dahulu dalam bentuk task di Workspace. Hasil dari scraping tersebut dapat dilihat dalam bentuk rincian, sehingga bisa dipilih akan menggunakan jenis informasi yang mana saja. Secara keseluruhan, sesi pelatihan ini benar-benar menarik dan dapat dipahami dengan mudah.
Melalui pelatihan ini, diharapkan kemampuan mahasiswa dalam mengoptimalkan pemanfaatan sumber informasi dari internet untuk keperluan akademis bisa meningkat. Banyak hal baru yang diperoleh dari pelatihan Web Scraping ini. Acara berakhir pukul 11.00 WIB dan diakhiri dengan foto bersama. (Y)