Menggunakan Mine Data Google

Anonim

Adakah anda "googled" hari ini? Adakah anda mencapai halaman ini dengan "googling"?

Sekiranya demikian, anda telah melihat masa depan, dan anda adalah sebahagian daripadanya, walaupun anda tidak menyedarinya. Malah, terdapat banyak lagi yang berlaku di Google daripada hanya mencari. Saya akan bercakap tentang apa yang Google lakukan, tahu - serta apa yang harus anda lakukan dan tahu untuk mendapatkan yang terbaik daripada itu.

$config[code] not found

Benar, Google terkenal dengan enjin cariannya yang kuat, yang menarik kepada laman web, video, imej, petikan saham, nombor telefon, alamat, dan media dan data lain untuk menyediakan maklumat yang relevan - semua dalam masa yang diperlukan untuk menyerang kunci.

Nama enjin carian terbesar di dunia telah menjadi identik dengan mencari Internet. Ia bahkan menjadi kata kerja dalam bahasa sehari-hari kami (walaupun Google tidak suka kita menggunakannya seperti itu): kami "google" ulasan kereta, alamat teman zaman kanak-kanak kami, dan, dalam penerbangan mewah dan keagungan, diri kita sendiri.

Sangat mudah lupa bahawa kita tidak bersendirian apabila kita mencari. Semua yang kami lakukan dalam persekitaran Google (dan beberapa perkara yang kita lakukan di luarnya) direkodkan, disimpan, dan dianalisis. Sebaik sahaja anda tahu bahawa sesebuah syarikat mempunyai banyak data yang tersedia, tidak lama lagi untuk menyedari bahawa semua maklumat ini boleh digunakan untuk lebih daripada sekedar pengalaman carian yang menyenangkan.

Untuk memahami sepenuhnya potensi kuasa Google, duduk kembali sejenak dan pertimbangkan bagaimana Google berfungsi dengan lebih terperinci. Bagaimana Kerja Google

Untuk pencari kasual, ia tidak semestinya jelas bagaimana Google mencari Internet begitu cepat dan dengan hasil yang baik itu. Rahsia ialah apabila anda menaip pertanyaan mereka tidak mencari Internet sama sekali; Sebaliknya, Google mencari pangkalan data yang terus berkembang dan mengemas kini, 24 jam sehari, 7 hari seminggu.

Semua ini berlaku tanpa campur tangan manusia. Program kecil yang dipanggil "labah-labah" atau "crawler" secara bebas mengikuti pautan dari satu halaman ke halaman lain, cara labah-labah mengikuti benang webnya. Apabila labah-labah merangkak di seluruh laman web, mereka mengumpulkan maklumat tentang setiap kalimat, imej, nombor telefon dan apa saja yang mungkin mereka hadapi. Mereka mengimbas setiap halaman yang mereka lawati, kata kunci indeks dan pautan nota ke dan dari halaman. Kemudian maklumat ini disimpan dalam pangkalan data yang besar. Pautan dan halaman yang sama merangkak lagi dan sekali lagi, memastikan bahawa maklumat Google tetap semasa.

Google meletakkan laman dengan menggunakan maklumat yang dikumpulkan oleh laba-laba. Termasuk dalam proses ranking ini adalah berikut:

  • kekerapan kata kunci dan lokasi (lebih banyak kata kunci di lokasi yang lebih menonjol adalah lebih baik);
  • umur halaman (halaman yang lebih mantap, lebih baik);
  • bilangan halaman yang menghubungkan ke halaman (semakin banyak pautan yang lebih baik).

Ada faktor-faktor lain yang dianggap oleh Google, tetapi ini dirahsiakan untuk menghalang mereka yang akan cuba memainkan sistem dan mendapat peringkat tinggi tanpa memberikan maklumat yang berguna. Di samping itu, jika anda melampaui batas dan hanya mengisi halaman anda dengan maklumat berlebihan, senarai kata kunci, dan pautan sampah, Google akan menghukum anda atau mungkin menjatuhkan laman web anda dari pangkalan data. Jelas sekali, keseimbangan yang baik mesti dipukul. Faktor-faktor keseimbangan di halaman ini sama seperti seni sains.

Lebih baik skor halaman mengikut kriteria ini, semakin tinggi kedudukannya dalam hasil carian. Halaman peringkat tertinggi muncul pada halaman pertama carian Google; kerana kebanyakan pengguna Google tidak pernah mencuba melewati halaman pertama, halaman peringkat tinggi mendapat jumlah lalu lintas Internet yang tidak seimbang.

Semua ini untuk mengatakan bahawa, apabila anda menjalankan carian di Google, ia boleh bertindak balas dengan cepat kerana ia tidak cuba mencari seluruh Internet pada saat itu; ia adalah perundingan pangkalan data yang sangat teratur dan diprioritaskan. Tetapi lebih penting daripada membuat carian kilat, ini bermakna Google mempunyai repositori data yang luas tentang apa yang ada di Internet dan, yang lebih penting, siapa yang menggunakan apa, kapan dan untuk apa tujuannya.

Apa yang Google Tahu?

Google "tahu" banyak, sebenarnya. Google menjejaki carian, dan juga menyimpan fail pada carian tertentu anda berdasarkan alamat IP anda atau log masuk Google. Itu memberi mereka tingkap kecil ke dalam fikiran anda, mendedahkan apa yang menarik minat anda, bimbang anda, menggembirakan anda dan menakutkan anda. Ini sahaja adalah maklumat pemasaran yang kuat.

Jika anda boleh menerokai pangkalan data itu, anda boleh membina profil terperinci mengenai individu - kepentingan mereka, tabiat membeli, kebimbangan kesihatan, isu keluarga, dan banyak lagi. Anda boleh mengungkap tanda-tanda yang menunjukkan sama ada sesebuah syarikat berjaya atau gagal, sama ada ia sedang mempertimbangkan penggabungan atau pengambilalihan, dan barisan produk apa yang mungkin akan berkembang. Anda boleh menjejaki trend sejarah dalam pemilihan, ekonomi, penjagaan kesihatan, dan sebilangan kawasan lain yang mempunyai nilai sosial, kewangan dan politik yang signifikan.

Lebih-lebih lagi, jika anda, secara sedar atau tidak sedar, menggunakan perkhidmatan Google yang lain, anda masih menyediakan lebih banyak maklumat. Mereka mengimbas Gmail, mendapatkan maklumat yang sama dari surat-menyurat anda sebagai carian anda, serta rakan dan kolaborator anda. Jika anda berkongsi dokumen melalui dokumen Google, mereka tahu siapa yang anda bekerjasama, dan pada projek apa. Google Checkout menambah data mengenai corak pembelian anda, tabiat perbelanjaan anda, dan belanjawan anda.

Terdapat juga maklumat yang anda hantar kepada Google tanpa menyedari bahawa anda berbuat demikian. Google mengumpul, seperti perkhidmatan Internet lain, alamat IP anda dan kemungkinan alamat MAC anda. Alamat IP anda memberitahu mereka kira-kira di mana anda berada di dunia secara geografi, dan alamat MAC anda adalah tandatangan yang unik untuk mesin anda; ini membolehkan mereka mengesan sama ada anda sentiasa menggunakan mesin yang sama, berapa mesin yang anda gunakan, dan sebagainya. Jadi, bukan sahaja Google tahu apa yang anda cari dan siapa yang anda berkomunikasi, syarikat itu juga tahu di mana anda berada dan mesin atau mesin mana yang anda gunakan.

Sudah tentu, mari kita mengambil langkah mundur dan mengakui bahawa hampir semua laman Internet mempunyai akses kepada beberapa atau semua maklumat ini. Sebagai contoh, alamat IP dikumpulkan secara tetap untuk mempertahankan terhadap penggodam dan penyangkalan serangan perkhidmatan. Maklumat mengenai tempat anda pergi ke tapak seseorang, apabila anda tiba dan pergi, dan dari mana anda datang dan pergi ke, semua statistik web standard tersedia untuk walaupun tapak peribadi yang paling kecil.

Apa yang menjadikan Google berbeza adalah saiz dan kepelbagaian perkhidmatannya, membolehkannya mengumpulkan lebih banyak maklumat dari lebih ramai orang.

Apabila menyimpan maklumat anda dari beratus-ratus keping data hingga berbilion, anda mempunyai pemahaman yang tidak ada orang lain. Apa yang menjadikan Google benar-benar berkuasa ialah ia dapat memerhati orang dalam konteks lebih daripada yang lain. Google memantau anda walaupun anda tidak berada di komputer anda. Peta Google menyediakan gambar resolusi tinggi kebanyakan Amerika Syarikat, serta beberapa kawasan lain di dunia. Mungkin rumah anda dapat dilihat di Peta Google, dan, jika anda kebetulan menyiram halaman ketika satelit terbang melewati masa lalu, anda mungkin juga dapat melihat diri anda dalam seluar pendek yang paling rapi!

Apa yang Boleh Google lakukan

Terdapat beberapa kegunaan yang jelas untuk pangkalan data Google, AdWords mungkin menjadi yang paling popular dan kelihatan pada masa ini.

Setiap kali anda menjalankan carian di Google, beberapa penyenaraian pertama di bahagian atas halaman, dan penyenaraian di sebelah kanan adalah "pautan yang ditaja", iklan berbayar yang dibeli oleh orang yang percaya bahawa pencari yang menjalankan carian seperti milik anda akan berminat dengan barangan dan perkhidmatan mereka. Teknik ini telah merebak ke laman web lain, yang menerangkan moniker "Iklan oleh Google" yang anda lihat menyampaikan iklan yang relevan untuk halaman laman web lain.

Jelas, menjual ruang iklan ini merupakan sumber pendapatan yang sangat baik untuk Google. Pada tahun 2007, AdWords membawa Google lebih daripada $ 16 bilion hasil, menjadikannya pendapatan terbesar Google setakat ini. Sebagai perbandingan, kedai data Google adalah lombong emas yang belum pernah ditoreh.

Setakat ini, ciri-ciri Google yang telah kita lihat telah memberi tumpuan terutamanya untuk bertindak balas terhadap trend pasaran semasa. Orang menjadi tertarik dengan sesuatu - versi baru X-Box, mencari talian elektrik, memorabilia Super Bowl, dan lain-lain - dan Google diletakkan untuk membantu orang ramai berhubung dengan bakal pelanggan mereka.

Bagaimanapun, dengan maklumat yang mencukupi, sebuah syarikat seperti Google boleh melakukan lebih daripada sekadar bertindak balas dengan masa kini dengan kelajuan kilat. Ia juga boleh melihat masa depan, atau mencipta masa depan. Sebelum anda berfikir ini hanyalah satu-satunya fenomena sains fiksyen paranoid, berikan isu pertimbangan.

Mari kita ambil satu kes mudah. Katakan anda menyediakan satu program untuk mencatatkan carian yang gagal menyenaraikan mana-mana carian yang gagal dalam ranking yang tidak memberikan maklumat yang benar-benar berguna kepada pencari. Program yang menjejaki kegagalan ini mencatatkan apa yang dicari oleh pencari, dan meletakkan carian yang gagal dalam kategori.

Melihat melalui langkah-langkah tersebut, bagaimana jika Google mendapati bahawa terdapat sejumlah besar carian yang gagal yang semua berkaitan dengan mencari superstore do-it-yourself di Thermopolis, WY. Sedikit lebih banyak melihat, dan saya mempunyai senarai tempat di mana terdapat banyak carian DIY mencari penjual superstore. Senarai itu akan menjadi sangat berharga bagi sebuah syarikat yang menyimpan kedai-kedai DIY (tidak menamakan sebarang nama, tetapi memikirkan gudang-gerbang oren besar di setiap pinggir bandar: tidakkah mereka suka tahu?).

Mereka bukan sahaja tahu bahawa tiada kedai DIY di sana, tetapi bilangan tertentu orang mencari kedai itu. Dan mereka mungkin mempunyai idea apa yang mereka harapkan untuk membeli di sana: peralatan, bahan binaan, gril gas, dll. Ini adalah penyelidikan pasaran yang tidak menyakitkan, disusun dengan kemas dan dianalisis oleh Google secara automatik.

Dengan cara yang sama, maklumat ini boleh digunakan untuk mengenal pasti pembeli berpotensi untuk produk tertentu, menjejaki penjenayah yang terlibat dalam pornografi kanak-kanak, dan menangkap pencuri berpotensi menutup rumah atau kedai. Ia boleh membantu pemaju memilih tapak untuk rumah dan kedai baru, memberi amaran kepada cuaca buruk di kawasan anda, cari pengundi berdaftar dan belajar tentang tabiat dan minat mereka, dan membantu IRS mencari orang yang menipu cukai mereka. Terdapat juga kesilapan tafsiran: sekumpulan pencarian tentang kanser dari sebuah bandar kecil mungkin bermakna banyak pesakit kanser, tetapi ia juga boleh bermakna ada sekolah perubatan di sana.

Seperti yang anda dapat lihat, kami boleh memuji beberapa kegunaan maklumat ini, dan menghukum orang lain. Tetapi mereka semua mungkin, dan semua menggunakan teknik asas yang sama. Anda boleh mencari hampir apa sahaja yang anda mahu, anda hanya perlu tahu bagaimana untuk mencarinya.

Dalam artikel saya yang seterusnya, kita akan melihat apa yang semua ini bermakna kepada anda sebagai individu … dan sebagai seorang usahawan. Lompat ke: Tambang Data Google dan Perniagaan Anda.

* * * * *

Mengenai Pengarang: Hamlet Batista adalah Presiden NEMedia S.A, penyedia perisian automasi SEO yang membantu para usahawan dan usaha kecil meningkatkan kualiti trafik pencarian semulanya sambil memberi fokus pada apa yang mereka lakukan dengan sebaik-baiknya. Blog Hamlet, Hamlet Batista dot Com, meneroka penyelidikan SEO yang paling maju, serta strategi dan taktik yang dapat memberikan kelebihan penting kepada pesaing anda.

17 Komen ▼