Жизнь Евы.Ру

Тайны в онлайне


Тайны в онлайне


Возможно, вы уже сталкивались с рассуждениями о том, что если собрать воедино все, что человек пишет о себе в различных уголках интернета, может получиться целое досье. И досье это не выпытали враги, не выкрали шпионы. Мы сами рассказываем о себе, хвастаемся фотографиями детей, кузин и внучатых племянников.

Так что же, скажете вы, не рассказывать, не показывать и выключить интернет, дабы избежать соблазна и отгородиться от потенциальных выпытывателей и разведывателей? Нет! Отнюдь.

Не будем впадать в панику и постараемся с помощью этой статьи разобраться, как можно спокойно и комфортно существовать на просторах интернета.

А для начала попробуем понять, что же именно мы позволяем найти о себе в интернете.

Первый укол нашей приватности мы замечаем при регистрации на сайте Ева.Ру - требование ввести в регистрационные поля логин, ник и e-mail. После регистрации на почту нам высылается пароль. Но спокойно! Это не страшно и совсем не больно. Никому, никогда, даже под пытками Ева.Ру своих не выдаст (в скобочках заметим, что мы, разумеется, говорим о порядочных законопослушных гражданах, которые не давали повода разнообразным государственным службам искать их). Логин, пароль и e-mail являются конфиденциальной информацией, которую не могут видеть другие пользователи и гости сайта (относительно e-mail это верно, если в паспорте мы оговорим не показывать свой e-mail).

Но на этом выпытывание наших тайн заканчивается. Как, впрочем, и обязательства хранить тайну. Ведь тайн больше нет. Дальше - только наша свободная воля, наше желание рассказать миру побольше о том, какие мы замечательные, как благозвучно наше имя, как прекрасны наши дети и т. д. (см. список родственников выше). И в этом невинном, но понятном желании нравиться миру мы забываем об одной детали: все личные данные, фотографии, выложенные в паспорте пользователя, становятся доступными для просмотра любому человеку, зашедшему на сайт Ева.Ру. А значит, и «роботу» поисковой системы.

Все мы не раз использовали поисковые системы для нахождения разнообразнейшей информации. Чтобы разобраться в том, каким образом информация, выложенная в наших паспортах, может быть найдена любым посторонним человеком, мы должны выяснить, как именно работают поисковые системы. Да простят нас профессионалы за поверхностность и простоту нижеследующего текста, но поделать мы с собой ничего не можем.

А непрофессионалов просим следовать за нами и не слишком скучать при обнаружении такого количества технических подробностей. Мы постараемся недолго…

Для этого нам придется познакомиться с основными компонентами поисковика.

Итак, поисковая система состоит из следующих частей:

Spider (паук) - это программа, которая скачивает веб-страницы и сохраняет их в базе данных поисковой системы.

Crawler (краулер, «путешествующий» паук) - программа, которая автоматически проходит по всем ссылкам, найденным на странице. Его задача - определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Краулер, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе.

Indexer (индексатор) - программа, которая анализирует веб-страницы, скачанные пауками.

Database (база данных) - это хранилище всех данных, которые поисковая система скачивает и анализирует. Иногда базу данных называют индексом поисковой системы.

Search results engine (система выдачи результатов) - извлекает результаты поиска из базы данных. Система выдачи результатов занимается ранжированием страниц. Она решает, какие страницы удовлетворяют запросу пользователя, и в каком порядке они должны быть отсортированы.

Web server (веб-сервер) - осуществляет взаимодействие между пользователем и остальными компонентами поисковой системы.

Теперь посмотрим более подробно, как именно поисковая система находит, обрабатывает и отображает информацию в соответствии с запросом.

Бродя по интернету, робот-паук обнаруживает неизвестный ему сайт. Скачав главную страницу, паук находит на ней все имеющиеся ссылки на другие страницы сайта. Проходя по ссылкам, паук скачивает и эти страницы. И так далее, пока не перестанет обнаруживать новые ссылки и новые страницы. Все найденное паук сохраняет в базе данных и дает команду индексатору приступить к обработке страниц. На этом работа паука закончена.

Перед тем как рассказать о работе индексатора, отвлечемся немного, чтобы сказать пару слов о том, из чего состоят страницы сайтов.

Для создания страниц сайта используется так называемый «язык разметки текста» - HTML (hypertext markup language). Он состоит из набора тэгов - специальных последовательностей символов, описывающих внешний вид и расположение текста и картинок на странице. Но кроме тэгов, отвечающих за отображение видимых элементов страницы, существуют «невидимые» тэги. Большинство из них нас сейчас не интересуют. Для поисковика важен тэг meta keywords. В нем прописывают слова, являющиеся ключевыми для этого сайта. Пишут их там непосредственно для того, чтобы поисковик их нашел.

Теперь мы можем вернуться к индексатору поисковика. Эта программа анализирует сохраненные в базе данных страницы сайта, определяет для себя, какие слова на этой странице являются ключевыми. Для поиска этих ключевых слов индексатор использует как метатэги, так и слова, каким-либо образом выделенные на странице (заголовки, жирный шрифт, курсив и т. п.). После этого все слова, которые индексатор счел ключевыми, он заносит в отдельную базу данных, где хранятся ключевые слова со всех найденных сайтов.

Затем начинает работать система выдачи результатов. В первую очередь, путем сложной обработки каждое из ключевых слов получает определенный рейтинг. Этот рейтинг зависит от многих факторов. Основными из них являются два: насколько часто это слово запрашивается при поиске и насколько популярен сайт, на страницах которого это слово присутствует.

Популярность сайта напрямую зависти от его посещаемости. И в первую очередь степень популярности сайта определяет, на каком месте в результатах поиска окажется страница сайта, содержащая искомое слово.

Если мы возьмем ник или ФИО из любого паспорта пользователя Евы.Ру и зададим их поиск в поисковой системе, мы увидим, что ссылка на еварушный паспорт окажется одной из первых в результатах поиска. Это произойдет потому, что Ева.Ру является одним из самых посещаемых сайтов рунета. При этом если мы уберем из паспорта все личные данные, в результатах поиска они еще будут какое-то время появляться. Дело в том, что эта информация уже имеется в базе данных поисковой системы. Раз попав в базу, она остается там до тех пор, пока поисковый робот-паук не зайдет еще раз на сайт и не скачает страницы уже без этих данных. А от одного посещения сайта пауком до другого может пройти и несколько месяцев.

Резюмируя, хочется подчеркнуть еще раз: нужно понимать, что информация, которая уже есть в базе данных поисковой системы, не удалится оттуда мгновенно, даже если исчезнет со страниц сайта, где она была найдена. Информация, выложенная в паспорте, через некоторое время будет доступна всем.

Никто не говорит, что за пользователями Ева.Ру ведется постоянный и неусыпный надзор. Мы не призываем немедленно очистить паспорта и больше никогда ничего туда не выкладывать. Боже упаси! Нужно лишь помнить об ответственности, которую вы берете на себя, размещая в паспорте личную информацию. Этой статьей мы только пытались намекнуть, что каждый человек - сам кузнечик своего счастья. А болтун, как известно… ну, вы знаете…;)


Afi


Названия и определения взяты из статьи "Общие принципы работы поисковых систем"



Статья заняла третье место в конкурсе "Общие статьи"

Ссылки по теме

Дата Автор Комментарий
17.12 20:40 Газетка супер-статья
17.12 21:19 Линейка Видимо, я совсем НЕпрофессионал. Может быть, с утра лучше усвоится... Ничего сложного, но мозг завис.
17.12 22:00 Матрёшка +++ Интересно...
18.12 01:39 Васильковая мама - СВЕТА4КА да читайте, завидуйте...:)
18.12 02:03 olichka83 Надо будет распечатать и поизучать потом в спокойной обстановке :)
Отличная статья!
19.12 04:02 shun "Логин, пароль и e-mail являются конфиденциальной информацией, которую не могут видеть другие пользователи и гости сайта" за исключением некоторых глюков, когда скрытые e-mailы оказывались видны :)
А по поводу "досье" я считаю, что раз уж я есть такой человек на свете и трачу свое время и силы в интернете, то должна хотя бы делать это от своего имени. Если кому-то приспичит собирать "досье", пусть собирает :)
19.12 12:02 Лика+ даааааа...стоит наверное задуматься куда и что размещать.
19.12 21:11 Golomisik Конечно, все подряд размещать не стоит, но если все время об этом думать, то до паранойи рукой подать...Уж очень навязчиво последнее время эта тема муссируется- к чему бы это?
20.12 01:05 yaskrava быстренько в google и проверять...проверять...
21.12 12:34 Katy_Kas Так что, граждане, все в ваших руках - можете слепить себе в Интернете по вашему желанию образ героя или злодея! И не забывайте, что Интернет читают ваши конкуренты и потенциальные работодатели.
21.12 19:05 Squaw несколько лет назад я устроилась на работу в компанию, которая при проверке сведений о новом сотруднике искала всё, что связано с этим человеком, в интернете. И мне было слегка неловко, когда в Особый Отдел попал мой рассказ о родах...
28.12 01:34 baba-jaga Дааа! Стоит задуматься!
13.01 06:19 ЛаРиСа Я считала, что это всем и так понятно! Но статья хорошая и нужная
23.01 22:05 Лилу123 Полностью согластна!
02.02 09:05 ЕlenaP статья хорошая...
20.02 14:51 baggy Ну что ж, будем надеется, что нас не сдадут...
15.03 21:08 feitch всё логично:) мы сами решаем какую инфу о себе делаем доступной
20.03 09:43 nataandr В настоящее время появилось много сайтов (плана одноклассники) где действительно про человека можно узнать слишком много. Все-таки не стоит выставлять свою личную жизнь на всеобщий показ.

20.03 18:13 три оськи Стоит задуматься...
30.03 20:23 Регина86 а вот теперь стоит задуматься.
14.04 18:17 Luchy статья полезная:)
19.04 12:12 Регина86 Мда, думаю думаю подумаю.
23.04 14:30 irissskaaa Да уд, есть очем подумать...Спасибо
03.05 10:47 Зоя79 Мне вроде прятаться не от кого...
03.05 20:03 fetch Согласно, об этом не стоит забывать
09.05 13:43 Татьяна Осипова Очень познавательная статья! Действительно, гуляя в просторах интернета, не следует забывать о бдительности!!!
20.05 18:17 Lenok S Статья отличная, особенно для новичков!!!
12.06 23:12 bobteil Статья хорошая.Все ясно написано.
21.06 11:13 Элен-1983 Статья хорошая,но врятли ,кто-то покуситься на меня лично,я же не принцесса какая-нибудь)))А о себе информацию оставить надо немножко,для потомков хотябы)
08.07 23:35 НаСтЮшКа Хорошая статья.
25.07 15:51 franci хорошая статья
31.07 16:50 evadrim согласно
30.08 02:41 zmira хорошая статья
16.09 16:39 olik-7 Да, статья заставляет о многом серьезно подумать. С одной стороны не хочется постороннего вмешательства в свою жизнь. С другой стороны…. кто-то из великих сказал, что вечно живут лишь те люди, жизнь которых описана в книгах. Может это наш шанс? :-)
19.09 17:21 Berezkina неплохая статья, немного нового извлекла для себя!
22.09 16:48 monagua задумалась....
08.10 20:48 larissa-leit-1 Статья нужная, заставляет подумать!
30.10 23:02 alnedana Познавательная статья. Интересно.
02.11 00:28 ноля Интересно, даёт задуматься.
02.11 15:44 galaes Позновательно. и многим не лишне.
15.12 19:45 Вересаева я всегда об этом догадывалась... спасибо за статью
24.11 10:52 Грот-мачта Всегда полагала, что это самоочевидно.