Review Search Engine Google
Teknologi AI ( Artificial Intelligence ) belakangan ini sangat pesat sejak pertama kali dikembangkan di laboratorium MIT pada tahun 1940an. Sekarang aplikasi AI sudah mencapai dalam kehidupan tiap manusia. Hal ini dikarenakan hubungan manusia dengan komputer ( mesin ) yang semakin erat. Dalam banyak hal,peranan manusia telah digantikan oleh komputer pintar yang diprogram khusus untuk berpikir dan bergerak seperti manusia.
Dalam teknologi internet-pun AI juga hampir tidak bisa dipisahkan. Google Inc,. adalah sebuah contoh penerapan AI yang paling banyak digunakan dalam berinternet. Google menyediakan layanan untuk mencari informasi berupa halaman web yang terdapat pada database Google yang berisi lebih dari 2.000.000.000 halaman web. Melalui layanan berbasis web ,Google membantu mensortir halaman – halaman yang diminta sesuai dengan ‘rank’ tiap halaman. Google dengan sistem cerdasnya mampu menandai tiap halaman dengan sebuah rank,lalu menampilkan halaman hasil pencarian sesuai dengan rank tertinggi sampai terendah.
Pencarian dengan Google
Dalam penerapan sistem cerdas berbasis algoritma PageRank, inilah tahap – tahap proses pencarian pada Google :
1. Membaca dan memilah query.
2. Mengubah kalimat menjadi wordID.
3. Mencari kata dokumen yang dicari berdasarkan query dalam database secara singkat.
4. Mencari dari hasil proses ketiga ,apakah ada yang mengandung semua kriteria secara utuh.
5. Menghitung rank dari dokumen tersebut.
6. Jika dokumen tidak ditemukan, kembali ke proses keempat dengan mencari dalam database secara penuh ( full scan ).
7. Jika belum selesai ,kembali ke step 4.
8. Mengurutkan dokumen berdasarkan rank-nya lalu selesaikan proses.
Dalam mencari sebuah halaman berdasarkan query, Google mengindekskan halaman – halaman web yang terdapat dalam databasenya dengan informasi – informasi spesifik yang melebihi search engine lainnya. Google menyimpan judul ( title, keyword, url, teks ) dimana search engine lainnya hanya mengandalkan pada keyword saja.
Algoritma Pagerank sampai riset ini di ambil ( 2008 ) hanya efektif untuk query dengan satu kata ( single notation query ).Untuk query dengan dua kata atau lebih, maka penekanan lebih banyak dilakukan pada kecocokan content / isi dari halaman tersebut dengan kata query. Hal ini menyebabkan dibutuhkan sistem lain diluar search engine untuk membantu proses ini. Hal ini disambut dengan munculnya META DHTML Tag untuk keyword yaitu dengan menambahkan tag berikut pada halaman HTML :
1: <META content=”Dayat, eMje, Dayat eMJe” name=”keyword”>
Hal ini akan mencocokan keyword dengan content META keyword pada halaman HTML.
Algoritma Page Rank™
Algoritma Page Rank™ adalah sebuah algoritma perhitungan matematika yang digunakan untuk menghitung rank dari sebuah halaman web. Algoritma ini diciptakan oleh Sergey Brinn dan Lawrence Page, dua orang mahasiswa Computer Science Universitas Stanford. Pagerank adalah algoritma yang menghitung suatu nilai klasifikasi yang menilai seberapa penting suatu halaman adalah pada web. Google menggambarkan bahwa ketika satu halaman memiliki link ke halaman yang lain, maka nilai rank dari halaman tersebut akan bertambah. Semakin besar nilai rank dari suatu halaman, maka semakin penting pula halaman tersebut diperlukan dalam web. Nilai rank dari halaman yang mem-vote tersebut juga akan mempengaruhi nilai rank halaman yang di-link. Google mengkalkulasi suatu arti penting halaman dari jumlah halaman dengan rank tinggi yang memiliki link ke halaman tersebut.
Abstraksi dari penghitungan Page Rank™ adalah dengan mengkalkulasikan sebuah halaman dengan cara menjumlahkan halaman lain yang memiliki link ke halaman tersebut ( inbound link ).
( Gambar 1 )
Dari gambar diatas, dapat disimpulkan bahwa halaman B memiliki inbound link yaitu halaman A karena halaman A memiliki link yang menunjuk ke halaman B. Sedangkan halaman C memiliki rank tertinggi karena memiliki 2 inbound link yaitu A dan B.
Berikut adalah rumus perhitungan matematisnya :
Perhitungan sederhana ini kemudian dikembangkan kembali oleh kedua mahasiswa tersebut dengan modifikasi yang cukup signifikan. Rank sebuah halaman tidak hanya dipengaruhi dari jumlah inbound link yang dimilikinya,
namun juga memperhitungkan nilai rank dari halaman – halaman inbound linknya. Jadi misalkan untuk gambar yang sama ( Gambar 1 ), berikut adalah rumus yang kita dapat :
Dan berikut perhitungannya :
Perhitungan diatas tentu sangat mudah mengingat kita hanya memperhitungkan 3 halaman yang berkaitan. Namun pada kenyataannya di Internet terdiri dari jutaan halaman dan Google dapat memprosesnya dengan sangat cepat ,bahkan dalam hitungan detik. Kunci dari kecepatan pemrosesan ini terdapat pada iterasi (pengulangan ) pada algoritma PageRank ™ untuk tiap halaman. Menurut Sergey Brinn, setidaknya diperlukan 100 pengulangan / iterasi untuk tiap halaman untuk mendapatkan nilai Page Rank dalam web ( keseluruhan halaman yang berkaitan ).
Implementasi Page Rank ke dalam Google Sekarang ,kita akan membahas implem entasi / penerapan algoritma ini untuk digunakan dalam mesin pencari Google. Ada 3 faktor menentukan dalam tiap – tiap halaman yang diperlukan, yaitu :
- Faktor spesifik pada halaman ( title ,URL ,dll. )
- Teks penentu ( keyword) pada inbound link
- Page Rank
Untuk mendapatkan hasil yang sebenarnya, Google menghitung nilai IR ( Iterative Ranking ) dari faktor setiap halaman tertentu dengan keyword pada link inbound dan yang dijadikan acuan adalah penekanan pada keyword yang menjadikan tingkat kesesuaian dengan query yang dikirim oleh user. Nilai iteratif ini dilakukan berkali – kali untuk sebuah halaman sampai didapat nilai ‘sebenarnya’ baru iterasi ini akan berhenti. Hal ini dapat terlihat dengan jelas dengan sebuah istilah atau fenomena ‘Google Dance’, maksudnya adalah hasil yang berbeda dengan search engine yang sama.
Jika anda membuka www.google.com, www2.google.com, dan www3.google.com dan mencoba search query dengan kata yang sama, maka dari ketiga alamat sub-domain Google tersebut akan muncul hasil yang berbeda, bahakan jika anda melakukan search kembali beberapa jam kemudian hampir dipastikan anda mendapat hasil yang berbeda kembali. Hal ini dapat dijelaskan sebagai berikut : setiap iterasi dari optimasi sebuah halaman secara bertahap disimpan di buffer diluar server utama Google. Setiap hasil perhitungan iterasi disimpan di database sekunder yaitu www2.google.com, dan www3.google.com.
Disinilah sebenarnya komputer simulator penghitung google bekerja, dan menyimpan nilai sementara. Jika sudah didapat hasil rank yang sebenarnya, baru komputer mengupdate nilai rank di database utama google.com. Nilai rank dari sebuah halaman secara tidak mutlak dipengaruhi oleh jumlah link inbound ( halaman yang me-link ke halaman tersebut ), misalnya halaman web www.web1.com memiliki 5 inbound link, dan halaman web www.web2.com memiliki 10 link inbound, maka nilai rank dari web www.web2.com adalah 2 kali lipat daripada www.web1.com. Namun jika sama sekali tidak ada inbound link ,maka nilai rank anda tidak akan terpengaruh dan tetap bernilai normal sesuai dengan jumlah indeks google. Outbound link dari halaman inbound link yang menunjuk ke web anda juga mempengaruhi nilai rank. Semakin sedikit outbound link dari halaman inbound link akan semakin baik.
Misalnya : halaman www.web2.com memiliki 5 link ke luar, diantaranya menunjuk ke www.web1.com. Lalu www.web3.com juga memiliki link yang menunjuk ke www.web1.com, tetapi www.web3.com meiliki 10 link keluar.
Dari contoh diatas ,maka nilai rank www.web1.com lebih tinggi 2 kali lipat dengan www.web2.com jika dibandingkan dengan www.web3.com yang memiliki jumlah outbound link 2 kali lebih banyak. Namun untuk menjaga keseimbangan dari indeks web,sistem cerdas dari Google ini menjaganya dengan sebuah nilai indeks yang konstan dan konsisten.
Misalnya indeks dari google adalah 100 halaman, maka hasil penjumlahan rank dari tiap – tiap halaman adalah tetap 100.
Jadi jika dalam sebuah website terdiri 10 halaman , dan dengan asumsi nilai rank awal dari sebuah halaman yang baru adalah 1, maka website kita sudah memilki nilai rank 10. Dengan logika sederhana, maka dapat disimpulkan jika anda ingin website anda memiliki nilai rank yang lebih tinggi, buatlah halaman semakin banyak. Jumlah halaman berbanding lurus linear dengan nilai rank.
Semoga Membantu
Author : Dayat eMJe





Post a Comment
Untuk menyisipkan kode pendek, gunakan <i rel="code"> ... KODE ... </i>
Untuk menyisipkan kode panjang, gunakan <i rel="pre"> ... KODE ... </i>
Untuk menyisipkan gambar, gunakan <i rel="image"> ... URL GAMBAR ... </i>