Apakah Ini Algoritma "Google Helpful Content"? Membedah Paper Penelitian dari Google

Teruntuk para praktisi SEO yang ketinggalan terkait update Google di akhir tahun 2022 kemarin, Google meluncurkan update yang dinamakan Google Helpful Content.

Pada update-an tersebut, Google menjelaskan bahwa mereka memprioritaskan konten-konten yang dibuat untuk memenuhi kepuasan user, bukan search engine semata.

Baru-baru ini, Google menerbitkan paper penelitian yang menjelaskan tentang bagaimana mengidentifikasi kualitas suatu konten atau halaman melalui AI (Artificial Intelligence).

Satu hal yang menarik adalah inti paper tersebut hampir mirip dengan cara kerja Google Helpful Content yang diluncurkan akhir tahun lalu.

Lantas, benarkah paper tersebut menjelaskan tentang algoritma Google Helpful Content? Bagaimana penjelasan dari isi paper itu secara keseluruhan? Yuk, kita simak bersama-sama!

Daftar Isi

Google Tidak Menyebut Nama Algoritma Tertentu di Sana
Sinyal-sinyal Algoritma Google Helpful Content
Machine Learning Mampu Memprediksi Kualitas Halaman
Alat Deteksi OpenAI GPT-2
AI Mendeteksi Segala Bentuk Spam
Hasil Penelitian Ini Menggambarkan Algoritma Helpful Content Update
Tiga Skor Penilaian Konten
Apakah Ini Algoritma Google Helpful Content?

Google Tidak Menyebut Nama Algoritma Tertentu di Sana

Tidak ada satu orang pun selain orang Google sendiri yang bisa memastikan bahwa paper ilmiah ini merupakan algoritma dari Google Helpful Content.

Semua orang hanya bisa berspekulasi mengenai hal itu dan mengemukakan pendapatnya masing-masing.

Kendati demikian, paper penelitian tersebut perlu diperhatikan dengan saksama karena kesamaannya dengan algoritma Google Helpful Content memunculkan hal yang menarik.

Lantas, kira-kira apa saja petunjuk atau sinyal yang telah dimunculkan oleh Google sejak pertama kali diluncurkannya update-an ini?

Sinyal-sinyal Algoritma Google Helpful Content

Sejak algoritma Google Helpful Content pertama kali diluncurkan, Google secara tidak langsung memberikan beberapa sinyal/petunjuk mengenai seperti apa algoritma terkait Helpful Content ini.

1. Meningkatkan pengklasifikasian

Salah satu pernyataan yang berisi petunjuk algoritma update ini dikeluarkan oleh Google melalui cuitan pada tanggal 6 Desember 2022.

Melalui akun @googlesearchc, Google memberikan petunjuk bahwa update-an ini meningkatkan pengklasifikasian Google serta berfungsi untuk seluruh konten dalam semua bahasa.

Pengklasifikasian yang dimaksud yaitu mengumpulkan data-data dan dikategorikan agar mudah diidentifikasi oleh Google.

2. Bukan tindakan manual atau spam

Sinyal lainnya yang perlu diketahui yaitu bahwa algoritma Google Helpful Content bukanlah tindakan manual atau spam, melainkan dilakukan secara otomatis.

Menurut penjelasan Google, pengklasifikasian dari algoritma Helpful Content dilakukan secara otomatis menggunakan machine learning model.

3. Menentukan ranking

Penjelasan dari adanya update Helpful Content ini adalah algoritmanya digunakan untuk menentukan peringkat konten pada search engine.

Hal ini merupakan salah satu sinyal baru yang dikeluarkan oleh Google dan akan dievaluasi lagi di masa mendatang.

4. Memeriksa konten dibuat oleh manusia atau tidak

Salah satu hal menarik dari sinyal algoritma Helpful Content yang dikeluarkan oleh Google adalah bahwasanya mereka mampu mendeteksi mana konten yang benar-benar dibuat oleh manusia dan mana yang dibuat oleh mesin.

Hal ini diperjelas lagi oleh Danny Sullivan Public Liaison for Search di Google, memberikan pernyataan seperti ini:

“Kami meluncurkan beberapa penyempurnaan pada search engine demi memudahkan user untuk menemukan konten yang dibuat oleh dan untuk manusia”

“Kami berharap dapat mengembangkan penyempurnaan ini agar semakin mudah dalam menemukan konten asli yang dibuat oleh dan untuk manusia di masa mendatang”

Dari pernyataan di atas, kita bisa simpulkan bahwa Google ingin meningkatkan kualitas konten yang tersebar di search engine dengan memprioritaskan konten yang dibuat oleh manusia, bukan untuk mesin semata.

5. Akan datang serangkaian update Helpful Content lainnya

Lebih lanjut lagi bahwa Danny Sullivan menegaskan kalau update-an ini merupakan serangkaian peningkatan yang akan dikembangkan oleh Google.

Dalam artian lain, update-an ini tidak hanya terpaku pada satu algoritma saja, melainkan terdiri dari beberapa sistem yang bersama-sama menyelesaikan tugas untuk membuang atau menghapus konten yang tidak bermanfaat.

Machine Learning Mampu Memprediksi Kualitas Halaman

Paper ini membahas mengenai Large Language Models (LLM) seperti GPT-2 yang dapat secara akurat mengidentifikasi konten yang berkualitas rendah.

LLM menggunakan alat klasifikasi yang dilatih untuk mengidentifikasi konten yang dihasilkan oleh mesin.

Selain itu, mereka juga menemukan bahwa alat klasifikasi yang sama juga mampu mengidentifikasi konten yang berkualitas rendah, meskipun tidak dilatih untuk melakukannya.

Pada dasarnya, LLM mampu belajar bagaimana melakukan hal-hal baru yang sebelumnya tidak pernah dilatih.

Melansir dari Search Engine Journal, sebuah artikel dari Universitas Stanford tentang GPT-3 yang membahas mengenai bagaimana LLM secara mandiri mampu mempelajari kemampuan menerjemahkan teks dari bahasa Inggris ke bahasa Prancis karena diberi lebih banyak data untuk dipelajari.

Artikel tersebut juga menjelaskan bahwa menambahkan lebih banyak data dapat menyebabkan munculnya perilaku baru, sebuah hasil dari pelatihan tanpa pengawasan.

Perilaku baru yang muncul memiliki kesamaaan terhadap paper penelitian yang dikeluarkan oleh Google. Mereka menemukan bahwa alat pendeteksi teks buatan mesin juga mampu memprediksi konten yang memiliki kualitas rendah.

Para peneliti menuliskan bahwa mereka mempunyai dua pekerjaan untuk riset ini:

“Pekerjaan kami ada dua; pertama, kami melakukan evaluasi dari sisi manusia bahwa alat klasifikasi yang digunakan untuk membedakan antara teks buatan manusia dan mesin muncul sebagai alat yang dapat memprediksi suatu kualitas halaman yang mampu mendeteksi konten kualitas rendah tanpa pelatihan apapun”

“Kedua, atas dasar rasa penasaran terkait sifat halaman kualitas rendah yang tersebar di search engine, kami melakukan analisa kualitatif dan kuantitatif terhadap 500 juta artikel di website. Hal tersebut menjadi studi berskala besar yang pernah dilakukan pada topik ini”

Kesimpulan dari penelitian tersebut adalah mereka menggunakan model pembuatan teks yang dilatih untuk menemukan konten buatan mesin dan menemukan bahwa perilaku baru muncul.

Maksud dari perilaku baru yaitu kemampuan untuk mengidentifikasi adanya konten berkualitas rendah.

Alat Deteksi OpenAI GPT-2

Para peneliti juga menguji dua sistem alat deteksi untuk mengetahui seberapa baik alat-alat tersebut dalam bekerja mendeteksi konten kualitas rendah.

Salah satu sistem yang digunakan yaitu RoBERTa. RoBERTa merupakan versi update dari BERT.

Berikut ada dua sistem yang diuji tersebut, yaitu:

Detektor GPT-2 berbasis RoBERTa OpenAI
GLTR (Statistical Detection and Visualization of Generated Text) menggunakan BERT dan GPT-2

Dari hasil pengujian dua sistem di atas, para peneliti menemukan bahwa detektor GPT-2 OpenAI lebih unggul dalam mendeteksi konten berkualitas rendah.

AI Mendeteksi Segala Bentuk Spam

Paper penelitian menyatakan bahwa ada pendekatan yang hanya berfokus pada kualitas bahasa.

Dalam penelitian ini, para peneliti menemukan terobosan baru, di mana mereka berhasil menggunakan detektor OpenAI GPT-2 untuk mengetahui kualitas bahasa yang dihasilkan oleh mesin atau manusia.

Tidak cuman itu, OpenAI GPT-2 juga tidak perlu dilatih secara khusus untuk mendeteksi konten yang mempunyai kualitas rendah tertentu.

Sistem ini bisa menemukan konten-konten kualitas rendah dengan caranya sendiri.

Hasil Penelitian Ini Menggambarkan Algoritma Helpful Content Update

Para peneliti menguji sistem OpenAI GPT-2 ke hampir setengah milyar website. Mereka menganalisa halaman website dengan mempertimbangkan berbagai macam hal, seperti panjang artikel, usia konten, dan topik.

Pada usia konten bukan berarti konten yang baru publish mempunyai nilai yang lebih rendah dari konten yang sudah publish lama.

Para peneliti hanya mengamati konten web berdasarkan waktu dan menemukan bahwa ada lonjakan besar terkait halaman dengan kualitas rendah mulai tahun 2019. Hal itu bertepatan dengan maraknya pembuatan konten buatan mesin.

Selain itu, analisa dari segi topik cenderung menunjukkan bahwa topik tentang hukum dan pemerintahan mempunyai kualitas yang tinggi.

Menariknya, para peneliti menemukan ada sejumlah besar konten tentang pendidikan yang berkualitas rendah dan menurut mereka berhubungan dengan situs yang menawarkan esai kepada siswa.

Google sendiri telah menyebutkan bahwa pendidikan adalah topik yang secara khusus akan dipengaruhi oleh Helpful Content update.

Hal ini disebutkan oleh Danny Sullivan:

“Pengujian kami terkait update-an ini akan meningkatkan hasil yang berkaitan dengan pendidikan online”

Tiga Skor Penilaian Konten

Dalam PDF General Guidelines Google terdapat Google Quality Raters Guidelines, di mana dalam bab tersebut menjelaskan bahwa terdapat empat skor untuk menentukan suatu kualitas konten, yaitu rendah, sedang, tinggi, dan sangat tinggi.

Para peneliti menggunakan tiga skor dari keempat tersebut untuk melakukan pengujian sistem baru, ditambah satu lagi yang tidak ditentukan.

Skor yang dibilang tidak ditentukan adalah dokumen yang tidak ternilai sehingga telah dihapus. Para peneliti menggunakan skor 0 untuk nilai rendah, 1 sedang, dan 2 yang paling tertinggi.

Berikut adalah penjelasan mengenai tiga skor Language Quality (LQ):

0=LQ rendah

Nilai ini didapatkan dari teks yang tidak dapat dipahami secara logika dan tidak konsisten.

1=LQ sedang

Teks dapat dipahami dengan baik, tetapi ditulis dengan kualitas yang buruk (terdapat kesalahan tata bahasa)

2=LQ tinggi

Teks dapat dipahami dengan baik dan ditulis dengan kualitas bagus (jarang terdapat kesalahan tata bahasa)

Apakah Ini Algoritma Google Helpful Content?

Paper penelitian dari Google benar-benar membuka mata bagi para content creator agar terus memperhatikan kualitasnya dalam mempublikasikan konten ke halaman website.

Para peneliti mengungkapkan bahwa paper yang dikeluarkan oleh Google ini benar-benar menjelaskan algoritma yang kuat karena mampu mendeteksi konten dengan kualitas rendah dan berpotensi menghapusnya.

Kendati demikian, paper ini masih belum pasti digunakan untuk algoritma Helpful Content. Akan tetapi, menurut Roger Montti melalui tulisannya di SEJ mengatakan bahwa ada kemungkinan penelitian-penelitian dari paper itu masuk ke dalam algoritma.

Penutup

Jika benar Google menggunakan algoritma di atas dalam mengidentifikasi konten berkualitas rendah, sebaiknya Anda perlu membuat konten dengan kualitas terbaik serta bermanfaat bagi user. Selain memberikan kepuasan user, konten Anda juga akan disenangi oleh Google karena mengandung manfaat yang besar.

Jadi, jangan menganggap bahwa tulisan di atas masih menjadi sebuah paper penelitian belaka. Ada kemungkinan semua algoritma di atas akan diterapkan oleh Google untuk mengetahui mana konten yang berkualitas rendah dan mana yang tinggi.

Kira-kira, teman-teman ada pertanyaan terkait artikel ini? Jika Anda, teman-teman bisa langsung bergabung ke dalam grup Telegram DailySEO. Ada banyak sekali praktisi SEO yang siap diajak diskusi perihal Google Helpful Content serta pembahasan SEO lainnya.

Selain itu, teman-teman juga bisa mengikuti kelas-kelas online dari kami yang akan berbicara mengenai SEO. Kelas online itu sendiri akan langsung dibawakan oleh Founder DailySEO, Ilman Akbar. Jadi, tunggu apa lagi? Segera daftarkan dirimu di sini!

Sumber:

Apakah Ini Algoritma “Google Helpful Content”? Membedah Paper Penelitian dari Google

1 Comment

Write A Comment Cancel Reply