Paggamit ng Mine Data ng Google

Anonim

Mayroon ka na ngayong "googled" ngayon? Naabot mo ba ang pahinang ito sa pamamagitan ng "googling"?

Kung gayon, nakita mo ang hinaharap, at ikaw ay bahagi nito, kahit na hindi mo pa napagtanto ang mga ito. Sa katunayan, marami pang nangyayari sa Google kaysa sa paghahanap lamang. I-pinag-usapan ko ang tungkol sa ginagawa ng Google, alam - pati na rin ang dapat mong gawin at malaman upang masulit ito.

$config[code] not found

Totoong tama, ang Google ay pinakamahusay na kilala sa kanyang makapangyarihang search engine, na kumukuha sa isang napakalaking database ng mga web page, mga video, mga larawan, stock quote, numero ng telepono, address, at iba pang mga chunks ng media at data upang magbigay ng may-katuturang impormasyon - lahat sa oras na kinakailangan upang hampasin ang isang susi.

Ang pangalan ng pinakamalaking search engine ng mundo ay naging magkasingkahulugan sa paghahanap sa Internet. Kahit na ito ay isang pandiwa sa aming pang-araw-araw na wika (kahit na ang Google ay hindi gusto sa amin gamit ito na paraan): namin "google" review kotse, kasalukuyang address ng aming mga kaibigan sa pagkabata, at, sa flight ng fancy at kadakilaan, ating sarili.

Madaling kalimutan na hindi tayo nag-iisa kapag naghahanap tayo. Ang lahat ng ginagawa namin sa kapaligiran ng Google (at ilang mga bagay na ginagawa namin sa labas nito) ay naitala, nakaimbak, at nasuri. Sa sandaling alam mo na ang isang kumpanya ay may magkano ang data na magagamit, hindi magtagal upang mapagtanto na ang lahat ng impormasyong ito ay maaaring gamitin para sa higit pa kaysa sa isang magandang karanasan sa paghahanap.

Upang ganap na maunawaan ang potensyal na kapangyarihan ng Google, umupo nang ilang sandali at isaalang-alang kung paano gumagana ang Google nang mas kaunting detalye. Paano Gumagana ang Google

Para sa kaswal na naghahanap, hindi ito agad na maliwanag kung paano mabilis na sinusubaybayan ng Google ang Internet at may magagandang resulta. Ang sikreto ay na kapag nag-type ka sa isang query hindi nila hinahanap ang Internet sa lahat; sa halip, ang Google ay naghahanap ng isang database na patuloy na lumalaki at ina-update, 24 oras sa isang araw, 7 araw sa isang linggo.

Ang lahat ng ito ay nangyayari nang walang anumang interbensyon ng tao. Ang mga maliliit na programa na tinatawag na "mga spider" o "mga crawler" ay nagsasarili ng mga link mula sa isang pahina papunta sa isa pa, ang paraan ng isang spider na sumusunod sa mga thread ng web nito. Tulad ng mga spider na nag-crawl sa mga pahina ng web, kinokolekta nila ang impormasyon tungkol sa bawat pangungusap, larawan, numero ng telepono at anumang bagay na maaaring makaharap nila. I-scan nila ang bawat pahina na kanilang binibisita, mga index ng keyword at mga link ng tala sa at mula sa pahina. Pagkatapos ang impormasyong ito ay naka-imbak sa isang napakalaking database. Ang parehong mga link at mga pahina ay nag-crawl muli at muli, tinitiyak na ang impormasyon ng Google ay mananatiling kasalukuyang.

Ang Google ay nagra-rank ng mga pahina gamit ang impormasyon na kinokolekta ng mga spider nito. Kasama sa proseso ng pagraranggo na ito ay ang mga sumusunod:

  • Keyword dalas at lokasyon (mas maraming mga keyword sa mas kilalang mga lokasyon ay mas mahusay);
  • ang edad ng pahina (mas mahusay na itinatag ang pahina, mas mahusay);
  • ang bilang ng mga pahina na nag-uugnay sa isang pahina (mas maraming mga link ang mas mahusay).

May mga iba pang mga kadahilanan ang isinasaalang-alang ng Google, ngunit ang mga ito ay pinananatiling lihim upang hadlangan ang mga na subukan ang laro ng system at puntos mataas na ranggo nang hindi aktwal na nagbibigay ng kapaki-pakinabang na impormasyon. Bilang karagdagan, kung pinalabis mo ito at punan mo lamang ang iyong pahina ng mga impormasyon, mga listahan ng mga keyword, at mga link sa basura, ang Google ay magpaparusa sa iyo o maaaring bumaba ng iyong site mula sa database. Maliwanag, ang isang mabuting balanse ay dapat na ma-struck. Ang balanse ng mga salik sa pahina ay kasing dami ng agham.

Ang mas mahusay na mga marka ng pahina ayon sa mga pamantayang ito, mas mataas ang hanay nito sa mga resulta ng paghahanap. Lumilitaw ang mga pinakamataas na pahina sa unang pahina ng isang paghahanap sa Google; yamang ang karamihan sa mga gumagamit ng Google ay hindi kailanman humantong sa nakalipas na unang pahina, ang mga mataas na ranggo ng mga pahina ay nakakakuha ng hindi katimbang na halaga ng trapiko sa Internet.

Ang lahat ng ito upang sabihin na, kapag nagpatakbo ka ng isang paghahanap sa Google, maaari itong tumugon nang mabilis dahil hindi ito sinusubukang maghanap sa buong Internet sa sandaling iyon; ito ay pagkonsulta sa mataas na organisadong at prioritized database. Ngunit higit na mahalaga kaysa sa paglikha ng mabilis na mga paghahanap, nangangahulugan ito na ang Google ay may malawak na repository ng data tungkol sa kung ano ang nasa Internet at, mas mahalaga, sino ang gumagamit ng kung ano, kailan at para sa kung anong layunin.

Ano ba ang Google?

"Alam ng Google" ng maraming, talaga. Sinusubaybayan ng Google ang mga paghahanap, at kahit na pinapanatili ang isang file sa iyong mga partikular na paghahanap batay sa iyong IP address o sa pag-login sa Google. Na nagbibigay sa kanila ng isang maliit na window sa iyong isip, na nagpapakita kung ano ang interes sa iyo, nag-aalala sa iyo, excites mo at frightens mo. Ang nag-iisa ay malakas na impormasyon sa marketing.

Kung maaari mong i-tap sa database na iyon, makakagawa ka ng mga detalyadong profile tungkol sa mga indibidwal - ang kanilang mga interes, pagbili ng mga gawi, mga alalahanin sa kalusugan, mga isyu sa pamilya, at higit pa. Maaari mong alisin ang mga palatandaan na nagpapahiwatig kung ang isang kumpanya ay nagtagumpay o nagkukulang, kung ito ay isinasaalang-alang ng isang pagsama-sama o pagkuha, at kung anong mga linya ng produkto ang maaaring lumawak ito. Maaari mong subaybayan ang mga makasaysayang trend sa halalan, ekonomiya, pangangalagang pangkalusugan, at anumang bilang ng iba pang mga lugar na may makabuluhang panlipunan, pinansiyal, at pampulitika na halaga.

Bukod dito, kung ikaw, sadyang alam o hindi, gumamit ng ibang mga serbisyo ng Google, nagbibigay ka pa ng karagdagang impormasyon. Ini-scan nila ang Gmail, na nakuha ang parehong impormasyon mula sa iyong liham tulad ng iyong mga paghahanap, pati na rin kung sino ang iyong mga kaibigan at mga tumutulong. Kung magbabahagi ka ng mga dokumento sa pamamagitan ng mga doc ng Google, alam nila kung sino ang iyong pinagtatrabahuhan, at kung anong mga proyekto. Nagdaragdag ang Google Checkout ng data tungkol sa iyong mga pattern ng pagbili, iyong mga gawi sa paggasta, at ang iyong badyet.

Mayroon ding impormasyon na ipinadala mo sa Google nang hindi nalalaman na ginagawa mo ito. Kinokolekta ng Google, tulad ng ibang mga serbisyo sa Internet, iyong IP address at posibleng iyong MAC address. Ang iyong IP address ay nagsasabi sa kanila ng halos kung saan ka sa mundo sa heograpiya, at ang iyong MAC address ay isang lagda na natatangi sa iyong makina; pinapayagan nito ang mga ito upang subaybayan kung palagi mong ginagamit ang parehong makina, kung gaano karaming mga makina ang iyong ginagamit, at iba pa. Kaya, hindi lamang alam ng Google kung ano ang iyong hinahanap at kung kanino ka nakikipag-ugnayan, alam din ng kumpanya kung nasaan ka at kung anong machine o machine ang iyong ginagamit.

Siyempre, bumalik tayo at aminin na halos lahat ng Internet site ay may access sa ilan o lahat ng impormasyong ito. Halimbawa, regular na nakolekta ang mga IP address upang ipagtanggol laban sa mga hacker at pagtanggi sa mga pag-atake ng serbisyo. Ang impormasyon tungkol sa kung saan ka pumunta sa isang site ng isang tao, kapag dumating ka at umalis, at kung saan ka nanggaling at pumunta sa, lahat ng karaniwang istatistika ng web ay magagamit sa kahit na ang pinakamaliit na personal na site.

Ang dahilan kung bakit ang Google ay naiiba ang laki at pagkakaiba-iba ng mga serbisyo nito, na nagpapahintulot nito upang mangolekta ng mas malawak na iba't ibang impormasyon mula sa maraming iba pang mga tao.

Kapag ang iyong imbakan ng impormasyon ay napupunta mula sa daan-daang mga piraso ng data sa bilyun-bilyon, mayroon kang pananaw na walang sinuman ang gumagawa. Kung bakit ang tunay na makapangyarihang Google ay maaari itong obserbahan ang mga tao sa mas maraming konteksto kaysa sa sinumang iba pa. Panoorin ka ng Google kahit na wala ka sa iyong computer. Nagbibigay ang Google Maps ng mga larawang may mataas na resolution ng karamihan ng Estados Unidos, pati na rin ang ilang ibang mga lugar sa mundo. Malamang na ang iyong bahay ay makikita sa Google Maps, at, kung nangyari sa iyo ang pagtutubig sa bakuran nang lumipad ang satellite sa nakaraan, maaari mo ring makita ang iyong sarili sa iyong pinakamahuhusay na pares ng kalsonsilyo!

Ano ang Gagawin ng Google

Mayroong ilang mga kapansin-pansing halata para sa database ng Google, maaaring ang AdWords ang pinaka-popular at nakikita sa ngayon.

Sa bawat oras na nagpapatakbo ka ng isang paghahanap sa Google, ang mga unang ilang listahan sa tuktok ng pahina, at ang mga listahan sa kanang bahagi ay "naka-sponsor na mga link," mga bayad na patalastas na binili ng mga taong naniniwala na ang mga naghahanap na nagpapatakbo ng isang paghahanap tulad ng sa iyo ay interesado sa kanilang mga kalakal at serbisyo. Ang pamamaraan na ito ay kumalat sa iba pang mga web page, na nagpapaliwanag sa moniker na "Ads by Google" na nakikita mong naghahatid ng mga may-katuturang ad para sa mga pahina ng iba pang mga website.

Maliwanag, ang pagbebenta ng puwang sa advertising na ito ay isang mahusay na pinagkukunan ng kita para sa Google. Noong 2007, nagdala sa AdWords ang Google ng higit sa $ 16 bilyon na kita, na ginagawa itong pinakamalaking pinagkukunan ng kita ng Google sa ngayon. Sa paghahambing, ang data store ng Google ay isang minahan ng ginto na halos hindi na-tapped.

Sa ngayon, ang mga tampok ng Google na nakita natin ay nakatuon lalo na sa pagtugon sa kasalukuyang mga uso sa merkado. Ang mga tao ay naging interesado sa isang bagay - ang bagong bersyon ng X-Box, paghahanap ng isang online na elektrisidad, memorabilia ng Super Bowl, atbp - at ang Google ay nakaposisyon upang matulungan ang mga tao na kumonekta sa kanilang mga potensyal na customer.

Gayunpaman, na may sapat na impormasyon, ang isang kumpanya tulad ng Google ay maaaring gumawa ng higit pa sa simpleng reaksyon sa kasalukuyan sa bilis ng kidlat. Maaari rin itong makita ang hinaharap, o kahit na lumikha ng hinaharap. Bago mo isipin na ito ay isang paranoydong pang-agham na pang-fiction, ibigay ang isyu sa ilang pagsasaalang-alang.

Kumuha tayo ng isang simpleng kaso. Ipagpalagay na nag-set up ka ng isang programa upang tandaan ang mga paghahanap na hindi mabubuksan ang anumang nabigyang mga pahina na nabigong mga paghahanap na hindi nagbibigay ng anumang talagang kapaki-pakinabang na impormasyon sa naghahanap. Ang programa na sumusubaybay sa mga kabiguang ito ay tumutukoy kung ano ang nais ng naghahanap, at inilalagay ang mga nabigong paghahanap sa mga kategorya.

Naghahanap sa pamamagitan ng mga tallies, kung ano kung napansin ng Google na mayroong isang malaking bilang ng mga nabigong paghahanap na ang lahat ay may kinalaman sa paghahanap ng isang do-it-yourself na superstore sa Thermopolis, WY. Ang isang maliit na higit pa naghahanap tungkol sa, at mayroon akong isang listahan ng mga lugar kung saan maraming mga nabigo DIY superstore paghahanap ng paghahanap. Ang listahan na iyon ay magiging napakahalaga sa isang kumpanya na nagbebenta ng mga tindahan ng DIY (hindi pagbibigay ng pangalan sa anumang mga pangalan, ngunit sa tingin ng mga malaking warehouses ng orange sa bawat suburb: hindi ba nila gustong malaman?).

Hindi lamang nila malalaman na walang tindahan sa DIY doon, ngunit isang partikular na bilang ng mga tao ang naghahanap ng gayong tindahan. At malamang na magkaroon sila ng ilang ideya kung ano ang inaasahan nilang bilhin doon: mga kasangkapan, mga materyales sa gusali, mga gas grills, atbp. Ito ay walang sakit na pananaliksik sa merkado, nang maayos na inayos at nasuri ng Google awtomatikong.

Sa parehong paraan ang impormasyong ito ay maaaring gamitin upang makilala ang mga potensyal na mamimili para sa isang partikular na produkto, subaybayan ang mga kriminal na nakikibahagi sa child pornography, at mahuli ang mga potensyal na magnanakaw na pambalot sa isang bahay o tindahan. Makakatulong ito sa mga developer na pumili ng mga site para sa mga bagong tahanan at tindahan, nagbabala sa iyo ng matinding panahon sa iyong lugar, hanapin ang mga nakarehistrong botante at alamin ang tungkol sa kanilang mga gawi at interes, at tulungan ang IRS na makahanap ng mga tao na manloko sa kanilang mga buwis. Maaaring may mga pagkakamali din ng interpretasyon: ang isang grupo ng mga paghahanap tungkol sa kanser mula sa isang maliit na bayan ay maaaring mangahulugan ng maraming mga pasyente ng kanser, ngunit maaaring ito rin ay nangangahulugan na mayroong isang medikal na paaralan doon.

Tulad ng makikita mo, maaari naming purihin ang ilan sa mga paggamit ng impormasyong ito, at ipagtanggol ang iba. Ngunit lahat sila ay posible, at lahat ay gumagamit ng parehong mga pangunahing pamamaraan. Maaari mong makita ang halos anumang nais mo, kailangan mo lamang malaman kung paano hanapin ito.

Sa susunod na artikulo, tatalakayin namin kung ano ang ibig sabihin nito sa iyo bilang isang indibidwal … at bilang isang negosyante. Tumalon sa: Ang Google Data Mine at ang Iyong Negosyo.

* * * * *

Tungkol sa May-akda: Ang Hamlet Batista ay Pangulo ng NEMedia S.A, isang provider ng SEO automation software na tumutulong sa mga negosyante at maliliit na negosyo na dagdagan ang kalidad ng kanilang natural na trapiko sa paghahanap habang nakatuon sa kung ano ang kanilang pinakamahusay na ginagawa. Ang blog ng Hamlet, Hamlet Batista dot Com, ay naglalarawan ng pinaka-advanced na pananaliksik sa SEO, pati na rin ang mga estratehiya at taktika na maaaring magbigay sa iyo ng isang mahalagang gilid sa iyong mga kakumpitensya.

17 Mga Puna ▼