Latent semantic indexing (LSI) atau latent semantic analysis adalah sebuah metode yang digunakan untuk menganalisis kumpulan dokumen untuk menampilkan statistik kata secara bersamaan yang kemudian memberikan wawasan terkait kata-kata dan dokumen tersebut.
LSI menggunakan teknik matematika untuk menemukan istilah terkait secara semantik di dalam kumpulan kata (sebuah index) di mana hal tersebut mungkin disembunyikan (terpendam).
Pada konteks di atas, sepertinya LSI ini mempunyai peran yang sangat penting di SEO (search engine optimization), ya kan?
Lagipula, Google sendiri merupakan “perpustakaan informasi” yang super besar, dan hingga kini kita telah banyak mendengar istilah tentang semantic search dan betapa pentingnya relevansi di dalam algoritma search ranking.
Jadi, apakah mungkin LSI ini dapat menjadi faktor yang memengaruhi ranking? Mari kita kupas fakta-faktanya.
Daftar Isi
- Klaim: Latent Semantic Indexing Merupakan Faktor yang Memengaruhi Ranking di Google Search
- Bukti: Apakah Latent Semantic Indexing Merupakan Salah Satu Faktor yang Memengaruhi Ranking?
- Bukti Sanggahan: Latent Semantic Indexing Bukan Faktor yang Memengaruhi Ranking
- Kesimpulan: Latent Semantic Indexing TIDAK DAPAT MEMENGARUHI RANKING
Klaim: Latent Semantic Indexing Merupakan Faktor yang Memengaruhi Ranking di Google Search
Sebetulnya klaim yang ada cukup sederhana:
Mengoptimasi konten web menggunakan LSI keyword akan membantu Google dalam memahami konten sehingga website Anda mendapatkan ranking yang lebih tinggi.
Backlinko menyinggung hal di atas pada artikel LSI keyword miliknya:
LSI (Latent Semantic Indexing) Keywords adalah konsep terkait istilah yang digunakan search engine untuk memahami konten lebih dalam di dalam sebuah webpage.
Dengan menggunakan related term (istilah terkait) secara kontekstual, teman-teman DailySEO ID bisa memperdalam pemahaman Google mengenai konten yang teman-teman buat.
Artikel backlinko tadi juga membuat beberapa argumen yang cukup menarik seputar LSI keyword ini:
- Google bergantung pada LSI keyword untuk bisa mengerti konten yang dibuat mendalam
- LSI keyword bukanlah sinonim. Namun, istilah yang mendekati keyword yang Anda targetkan
- Google tidak hanya menggunakan istilah yang sama persis ketika Anda melakukan penelusuran. Google juga menggunakan kata-kata dan frasa-frasa yang terlihat serupa.
Jadi, Anda harus benar-benar memperhatikan kata dan frasa yang ingin dimasukkan ke dalam konten.
Bukti: Apakah Latent Semantic Indexing Merupakan Salah Satu Faktor yang Memengaruhi Ranking?
Salah satu kunci yang membantu Google dalam menentukan konten terbaik di search engine results page (SERP) adalah relevansi.
Seperti yang sudah pernah Google jelaskan berikut ini:
Untuk memberikan hasil pencarian yang relevan atas query yang Anda ketikkan, maka kami (Google) perlu menetapkan seperti apa informasi yang Anda inginkan (maksud dari pencarian Anda).
Setelah intent (maksud) ditentukan:
…algoritma menganalisis konten yang ada di webpage untuk dinilai apakah webpage tersebut memiliki informasi yang mungkin relevan dengan apa yang Anda cari.
Google juga menjelaskan bahwa “sinyal ranking paling sederhana” dari relevansi adalah keyword yang digunakan oleh user tampil di dalam konten Anda.
Jika Anda tidak memasukkan keyword yang user cari, lalu bagaimana cara Google memahami bahwa konten Anda adalah yang terbaik?
Cukup masuk akal bukan?
Itulah mengapa beberapa orang percaya bahwa LSI ini adalah bagian dari faktor ranking.
Apabila hanya menggunakan keyword saja dianggap sebuah sinyal relevansi, maka apalagi menggunakan LSI keyword, pasti sinyal tadi akan menjadi lebih kuat.
Bukti Sanggahan: Latent Semantic Indexing Bukan Faktor yang Memengaruhi Ranking
John Mueller, Search Advocate Google, pernah secara jelas menyampaikan tanggapannya:
…kami tidak memiliki konsep LSI keyword. Jadi Anda bisa mengabaikan hal ini.
Sebetulnya ada cukup banyak kecurigaan di sebagian pandangan orang-orang SEO terkait Google yang mungkin mengatakan hal-hal yang “menyesatkan” untuk menjaga integritas algoritmanya.
Tapi, benarkah seperti itu? Mari kita ulas lebih lanjut lagi.
Pertama, penting untuk kita memahami apa itu LSI dan dari mana asal penamaan ini datang.
Latent semantic structure (LSS) pertama kali muncul sebagai sebuah metodologi untuk mengambil objek tekstual yang berasal dari file-file tersimpan di dalam sistem komputer pada akhir tahun 80-an.
Dengan demikian LSS ini menjadi sebuah contoh dari salah satu konsep information retrieval – IR (pencarian informasi) yang tersedia untuk para programmer.
Kemudian berbarengan dengan kapasitas penyimpanan komputer yang meningkat dan ketersediaan kumpulan data secara elektronik yang juga bertambah besar, maka pencarian informasi menjadi semakin sulit.
Para peneliti menjelaskan permasalahan yang mereka coba pecahkan di dalam sebuah paten yang diajukan pada tanggal 15 September 1988:
Sebagian besar sistem mewajibkan user atau penyedia informasi untuk menetapkan hubungan eksplisit dan link antara objek data atau objek teks, sehingga membuat sistem menjadi membosankan untuk digunakan atau diterapkan pada file informasi komputer yang besar dan heterogen yang isinya mungkin tidak dikenal oleh user.
Keyword matching (pencocokan kata kunci) pernah digunakan di IR pada waktu itu, namun keterbatasannya terbukti sejak lama sebelum Google ada.
Hingga kini, orang-orang terlalu sering melakukan pencarian menggunakan kata-kata yang tidak sama persis dengan kata-kata yang digunakan di dalam indeks, hal ini terjadi karena 2 hal:
- Synonymy: Beragam kata yang digunakan untuk menggambarkan satu objek atau ide yang memunculkan hasil relevan yang terabaikan.
- Polysemy: Makna berbeda dari satu kata yang menampilkan hasil tidak relevan yang diambil.
Kedua hal di atas masih menjadi sebuah persoalan hingga saat ini.
Namun, metodologi dan teknologi yang digunakan Google untuk memperbaiki relevansi sudah lama bergeser dari LSI.
Apa yang dikerjakan LSI secara otomatis menciptakan sebuah “semantic space” untuk information retrieval (IR).
Dan seperti yang dijelaskan di dalam paten, LSI menindak data yang tidak dapat dipercaya ini sebagai permasalah statistik.
Tanpa banyak masalah, sebenarnya para peneliti percaya bahwa terdapat struktur latent semantic dasar tersembunyi yang bisa mereka hilangkan dari data penggunaan kata.
Dengan melakukannya, maka makna latent akan terungkap dan mengizinkan sistem untuk menampilkan lebih banyak hasil relevan (hanya yang paling relevan) bahkan jika tidak ada exact keyword match (pencocokan kata kunci persis) di dalamnya.
Berikut bagaimana proses LSI seharusnya terlihat:

Dari gambar di atas kita dapat melihat ada 2 langkah terpisah yang terjadi:
Pertama, kumpulan data atau index mengalami Latent Semantic Analysis (LSA).
Kedua, query dianalisis dan index yang telah diproses lalu dicari kesamaannya.
Meskipun sedikit sulit untuk kita pahami, tapi itulah permasalah mendasar terkait mitos LSI sebagai faktor ranking Google.
Index Google sangatlah besar, di dalamnya terdapat milyaran halaman web, dan terus meningkat seiring waktu.
Setiap kali user mengetikkan query, Google menyortir index-nya dengan cepat untuk menemukan jawaban terbaik.
Sehingga Google diharuskan melakukan hal-hal di bawah ini jika mereka menggunakan metodologi di atas ke dalam algoritmanya:
- Membuat ulang halaman semantik menggunakan LSA di seluruh index-nya
- Menganalisis makna semantik dari query
- Menemukan kesamaan antara makna semantik dari query dan dokumen di ruang semantik yang dibuat berdasarkan keseluruhan index
- Menyortir dan memberikan ranking terhadap webpage yang Google temukan
Sangat sederhana memang, tapi prosesnya tidak terukur.
Proses ini cukup berguna untuk menemukan kumpulan informasi kecil, dan juga berguna untuk menemukan laporan yang relevan di dalam arsip dokumentasi perusahaan.
Paten tersebut menggambarkan bagaimana LSI bekerja, dan seperti itulah LSI didesain. LSI bisa dibilang istilah yang sederhana dalam hal pencarian informasi terkomputerisasi.
Kesimpulan: Latent Semantic Indexing TIDAK DAPAT MEMENGARUHI RANKING
Kesimpulannya, LSI sama sekali tidak bermanfaat untuk SEO bahkan hingga saat ini. LSI bukanlah faktor yang dapat memengaruhi ranking di Google Search.
Dan sudah sangat jelas, tidak ada bukti mengenai Google pernah menggunakan LSI untuk meningkatkan ranking sebuah website.
Pihak-pihak yang merekomendasikan LSI keyword terlalu terpaku dengan konsep yang tidak mereka mengerti, mungkin mereka tidak tahu bagaimana cara menjelaskan kata-kata yang memiliki keterkaitan itu penting di SEO.
Relevansi dan intent merupakan hal yang fundamental di dalam algoritma Google search ranking.
Sementara, semantik sendiri lebih kepada pemahaman kita tentang berbagai macam makna kata dan bagaimana kata-kata itu saling berkaitan.
Namun, LSI tidak ada hubungannya sama sekali dengan faktor ranking di Google Search.
Nah, bagaimana? Apakah teman-teman DailySEO ID sudah memahami faktor ranking Google yang satu ini?
Jika belum, silakan beritahu kami dengan cara menuliskan komentar di bawah atau bisa gabung ke grup Telegram di sini. Teman-teman juga bisa ajukan topik selanjutnya untuk kami bahas!
Sumber: