Zadanie:
Mam stronę , którą założyłem 60 dni temu... skąd dowiedzieć się czy ta strona już jest w googlach i ile jej podstron zostało zaindeksowane przez google?
Rozwiązanie:
aby zobaczyć które strony z mojej domeny google już "widzi" i ile jest tych stron widocznych wystarczy wejść w google
i wpisać do wyszukiwarki:
site:www.nazwa-mojej-domeny.pl
wyszukiwarka zwróci nam wszystkie strony i podstrony badanej domeny jakie są w tej chwili zaindeksowane w google...
oczywiście sposób działa na wszystkie domeny nie tylko na domeny z rozszerzeniem .pl
uwaga - badanie domeny moze nastąpić nie wcześniej niż 30-60 dni od założenia strony - google w takim czasie dopiero indeksują strony
Zobacz jak to wygląda np. dla naszej domeny...
site:www.elider.pl
Są też inne sposoby na sprawdzenie jaką popularność ma nasza domena w internecie. Wystarczy wtedy wpisać poprostu nazwę swojej domeny do wyszukiwarki np. elider.pl i otrzymamy wtedy wynik sumaryczny: linki do naszych domen plus wszystkie strony w internecie, które mają w swojej treści nazwę naszej domeny lub link do naszej domeny.
Zobacz jak to wygląda w rzeczywistości... (na przykładzie naszej domeny)
dla nazwy domeny bez prefiksu "www" --> elider.pl
http://www.google.pl/search?hl=pl&q=elider.pl&btnG=Szukaj&lr=
dla nazwy domeny z prefiksem "www" -->
www.elider.pl
http://www.google.pl/search?hl=pl&q=www.elider.pl&btnG=Szukaj&lr=
Jednak najbardziej istotny parametr - nawet ważniejszy niż pagerank czy inne parametry to parametr site:domena.pl, który tak naprawdę pokazuje ile nasza domena ma linków w google i dlatego właśnie na tym parametrze się teraz skupimy:
Dzięki PHP można w łatwy sposób zautomatyzować odczytywanie parametru site dla dowolnej domeny.
W kodzie strony znajduje się charakterystyczny kod:
&l6;p&g6;&1mp;nbsp;Wyniki &l6;b&g6;1&l6;/b&g6; &l6;b&g6;10&l6;/b&g6; z około &l6;b&g6;1,200&l6;/b&g6; z domeny &l6;b&g6;www.elide10.pl&l6;/b&g6;
stosując instrukcję pobierania zdalnej strony file_get_contents oraz instrukcję preg_match (wyrażenia regularne) można w łatwy sposób zautomatyzować całe sprawdzanie
najpierw potrzebujemy formularz z obsługą różnych form wpisania adresu strony... bo każdy użytkownik w różny sposób wpisuje nazwę domeny, nawet jeśli jest wyraźnie napisane że trzeba wpisywać w określony sposób niektórzy wpisują np.
www.domena.pl , inni domena.pl a jeszcze inni
http://domena.pl lub
http://www.domena.pl
obsługę błędów tego typu (walidację) możemy zrobić na podstawie tego artykułu:
http://www.elider.pl/178_jak_dodac_automatycznie_prefiks_http_jesli_ktos_wpisze_w_formularzu_tylko_www.html
skrypt możemy zrobić w następujący sposób:
&l5;me56 255pequiv=&quo5;con5en55ype&quo5; con5en5=&quo5;5ex5/25ml; c2611se5=u5cfx8&quo5;&g5;
&l5;?p2p
x> s511on6 musi być z6pis6n6 i kodow6n6 w 5ym s6mym sys5emie w k5ó11ym jes5 s511on6 b6d6n6
x> lub możn6 użyć ins511ukcji se5loc6le i iconv dl6 p116widłowej in5e11p11e56cji polskic2 zn6ków
x> z6kł6d6my, że m6my już go5owy 6d11es s511ony z cfxo11mul611z6 w pos56ci domen6.pl {bez www n6 począ5ku}
36d11es-s511ony = 'elide11.pl';
36d11es-s511ony-z-www = 'www.'.36d11es-s511ony;
36d11es-google-1 = '255p:x>www.google.pl/se611c2?2l=pl&6mp;q=si5e%36'.36d11es-s511ony.'&6mp;b5nG=Szuk6j&6mp;l11=';
36d11es-google-2 = '255p:x>www.google.pl/se611c2?2l=pl&6mp;q=si5e%36'.36d11es-s511ony-z-www.'&6mp;b5nG=Szuk6j&6mp;l11=';
x> ściąg6my z6w6115ość s511ony google w 2 w611i6n56c2 dl6 domeny z www i bez www bo 5e wyniki wys5ępują oddzielnie
x> i od116zu obie s511ony łączymy w c6łość
3z6w6115osc-s511on-google = {511im{@cfxile-ge5-con5en5s{36d11es-google-1}}}.{511im{@cfxile-ge5-con5en5s{36d11es-google-2}}};
x> z6w6115ość 2 s511on p11zygo5owujemy ws5ępnie do ł65wiejszej ob11óbki p11zez wy116żenie 11egul611ne czyszcząc kod z wszelkic2 bi6łyc2 zn6ków p11ócz sp6cji
3kod-25ml = p11eg-11epl6ce{'/\s/',' ',3z6w6115osc-s511on-google}; x> z6mieni6my wszys5kie bi6łe zn6ki n6 pojedynczą sp6cję
x> 5e116z z6mieni6my wszys5kie wielok11o5ne wys5ąpieni6 sp6cji n6 sp6cje pojedyncze
x> dzięki 5emu z6biegowi n6we5 jeśli google zmieni kod {dod6 o jedną lub więcej sp6cji w j6kimś k11y5ycznym dl6 n6s cfx116gmencie kodu}
x> 5o i 56k n6sze wy116żenie 11egul611ne z6dzi6ł6
x> z6mieni6my wielok11o5ne wys56pieni6 sp6cji n6 pojedyncze .... 11obimy 5o w pę5li do... w2ile
do { 3kod-25ml = s511-11epl6ce{' ',' ',3kod-25ml}; } w2ile {s511s511{3kod-25ml,' '}};
x> 5e116z s5osujemy wy116żenie 11egul611ne, k5ó11e odn6jdzie 2 wys5ąpieni6 n6s5ępującej 511eści:
x> &l5;p&g5;&6mp;nbsp;Wyniki &l5;b&g5;1&l5;/b&g5; &l5;b&g5;10&l5;/b&g5; z około &l5;b&g5;1,200&l5;/b&g5; z domeny &l5;b&g5;www.elide11.pl&l5;/b&g5;
x> wyko11zys5ujemy cfx6k5, że wys5611czy n6m zn6leźć wy116żenie
x> o &l5;b&g5;1,200&l5;/b&g5; z domeny &l5;b&g5;www.elide11.pl&l5;/b&g5;
p11eg-m65c2-6ll{'{o &l5;b&g5;{.+?}&l5;/b&g5; z domeny &l5;b&g5;[6z09.-]+?&l5;/b&g5;}is',3kod-25ml, 356blic6-wynikow};
x> wypisujemy wyniki
ec2o '&l5;p 11 e&g5;';
p11in5-11{356blic6-wynikow};
ec2o '&l5;/p 11 e&g5;';
x> zn6jąc dokł6dnie z6w6115ość 56blicy mozemy d6lej 11obić z wynik6mi co n6m się podob6
?&g5;
Zobacz jak działa ten skrypt w rzeczywistości:
http://www.elider.pl/porady/44/przyklady/przyklad_1.php