Dunia algoritma mesin pencarian selalu menarik untuk didalami. Bagaimana tidak, algoritma yang rumit dikembangkan dari waktu ke waktu untuk bisa menilai kualitas serta kredibilitas konten suatu website.
Dan algoritma terbaru mesin pencarian adalah SMITH atau Siamese Multi-Depth Transformer-based Hierarchical Encoder. Algoritma Smith ini memang menarik perhatian, karena diluncurkan setelah algoritma BERT digunakan pada mesin pencarian.
Banyak pihak, terutama para praktisi di bidang Search Engine Optimization (SEO) yang segera mencari tahu apa sebenarnya kelebihan algoritma ini dibandingkan pendahulunya. Memang belum ada terlalu banyak situs yang membahas detail mengenai algoritma Google SMITH pada mesin pencarian.
Namun kami akan mencoba membahasnya satu persatu pada artikel ini.
Algoritma Google SMITH Diklaim Lebih Ampuh Dari BERT
Mesin pencarian raksasa di dunia, Google, mengklaim jika salah satu algoritma search engine terbaru bernama SMITH Algorithm akan diterapkan pada sistem mereka. Memang berita ini belum resmi adanya, namun mereka telah menerbitkan penelitian terkait efek algoritma SMITH pada screening dokumen.
Kumpulan kode pada algoritma SMITH memang diklaim lebih unggul dari pendahulunya, yaitu algoritma BERT (Bidirectional Encoder Representations from Transformers). SMITH yang diterapkan pada mesin pencarian dianggap lebih mampu dan kapabel dalam melakukan pemahaman dokumen dalam ukuran yang lebih besar dan panjang.
SMITH merupakan model baru yang seakan menjadi pencerah masa depan keakuratan mesin pencarian sekelas Google Inc. Memang belum ditentukan secara spesifik bahwa SMITH akan diterapkan secara keseluruhan pada mesin pencari. Akan tetapi rumor ini membuat para pembuat konten dan pemilik website harus lebih memutar otak untuk menciptakan situs yang benar-benar autentik.
Algoritma BERT, dikenal sebagai media pengenalan kata-kata yang dirancang untuk memahami konteks kalimat dan paragraf secara keseluruhan. Akan tetapi, algoritma ini memiliki kuota karakter konten yang cukup sempit. Dan algoritma SMITH dirancang untuk melengkapi algoritma BERT yang sudah lebih dulu digunakan search engine.
Perbedaan Antara BERT Dan Algoritma Google SMITH
SMITH memang diciptakan untuk melengkapi BERT, walaupun belum diketahui secara pasti apakah SMITH akan permanen digunakan nantinya. Sebagai dua algoritma unggulan mesin pencari Google, BERT dan SMITH memiliki beberapa poin pembeda. Namun secara umum, keduanya memiliki fungsi untuk melakukan pemahaman terhadap konteks kalimat pada sebuah dokumen.
Algoritma Google BERT berfungsi untuk memahami kata – kalimat pada sebuah paragraf dan juga memprediksi “kata” yang hilang. Perbedaan yang paling mencolok adalah, algoritma SMITH dirancang untuk menemukan “kalimat” yang hilang dari sebuah paragraf. Sudah jelas bedanya, bukan? Dan sudah bisa terlihat jika skala pengecekan dokumen SMITH akan menjangkau space yang lebih luas.
Walaupun sebenarnya algoritma BERT sudah cukup canggih untuk melakukan screening dokumen, akan tetapi masih ada keterbatasan input yang bisa diseleksi. Untuk itu para ilmuwan di bidang ini menyarankan untuk penggunaan algoritma SMITH demi proses screening pada dokumen yang lebih panjang.
Pencocokan Semantik Yang Panjang Memang Menantang
Dokumen dengan panjang 500 kata dan 2.000 kata memiliki proses pencocokan semantik yang cukup berbeda. Inilah mengapa pencocokan semantik pada dokumen yang lebih panjang akan sangat menantang. Ada tiga faktor mengapa hal ini bisa terjadi, yaitu :
- Proses pencocokan akan lebih mendalam, termasuk pola pencocokan antar fragmen teks suatu dokumen
- Dokumen yang lebih panjang memiliki struktur yang lebih lengkap, sehingga algoritma mesin pencari harus bisa memahami dokumen secara keseluruhan
- Dokumen yang cukup panjang akan membuat habis memori TPU/GPU jika tidak disertai dengan algoritma yang paling tepat
Hal ini membuat para ilmuwan mempertimbangkan kinerja SMITH dengan baseline 2.048 dibandingkan BERT yang hanya memiliki baseline sebesar 512. Yang lebih menarik, SMITH hanya melengkapi kinerja BERT, dan tidak sepenuhnya menggantikan pendahulunya. Nantinya SMITH akan bertugas untuk mencocokkan long query dengan teks dokumen yang lebih panjang.
Kesimpulan
Belum ada kepastian apakah algoritma SMITH akan digunakan dalam skala besar dalam beberapa waktu kedepan. Yang pasti, telah ada makalah penelitian yang mengungkap jika SMITH adalah terobosan baru yang merupakan seni memahami konteks yang lebih panjang pada sebuah situs. Banyak pihak berharap jika nantinya algoritma ini bisa berguna untuk proses input dan screening konten di masa depan.
Kemarin kami juga sempat mengadakan sesi Live tanya jawab yang membahas tentang Algoritma ini, jika Anda belum menontonnya silahkan tonton disini:
Live Tanya Jawab Google Smith Klik >> Live