Рубрики
Жизнь Евы.Ру
Тайны в онлайне
Тайны в онлайне
Возможно, вы уже сталкивались с рассуждениями о том, что если
собрать воедино все, что человек пишет о себе в различных уголках
интернета, может получиться целое досье. И досье это не выпытали
враги, не выкрали шпионы. Мы сами рассказываем о себе, хвастаемся
фотографиями детей, кузин и внучатых племянников.
Так что же, скажете вы, не рассказывать, не показывать и выключить интернет, дабы избежать соблазна и отгородиться от потенциальных выпытывателей и разведывателей? Нет! Отнюдь.
Не будем впадать в панику и постараемся с помощью этой статьи разобраться, как можно спокойно и комфортно существовать на просторах интернета.
А для начала попробуем понять, что же именно мы позволяем найти о себе в интернете.
Первый укол нашей приватности мы замечаем при регистрации на сайте Ева.Ру - требование ввести в регистрационные поля логин, ник и e-mail. После регистрации на почту нам высылается пароль. Но спокойно! Это не страшно и совсем не больно. Никому, никогда, даже под пытками Ева.Ру своих не выдаст (в скобочках заметим, что мы, разумеется, говорим о порядочных законопослушных гражданах, которые не давали повода разнообразным государственным службам искать их). Логин, пароль и e-mail являются конфиденциальной информацией, которую не могут видеть другие пользователи и гости сайта (относительно e-mail это верно, если в паспорте мы оговорим не показывать свой e-mail).
Но на этом выпытывание наших тайн заканчивается. Как, впрочем, и обязательства хранить тайну. Ведь тайн больше нет. Дальше - только наша свободная воля, наше желание рассказать миру побольше о том, какие мы замечательные, как благозвучно наше имя, как прекрасны наши дети и т. д. (см. список родственников выше). И в этом невинном, но понятном желании нравиться миру мы забываем об одной детали: все личные данные, фотографии, выложенные в паспорте пользователя, становятся доступными для просмотра любому человеку, зашедшему на сайт Ева.Ру. А значит, и «роботу» поисковой системы.
Все мы не раз использовали поисковые системы для нахождения разнообразнейшей информации. Чтобы разобраться в том, каким образом информация, выложенная в наших паспортах, может быть найдена любым посторонним человеком, мы должны выяснить, как именно работают поисковые системы. Да простят нас профессионалы за поверхностность и простоту нижеследующего текста, но поделать мы с собой ничего не можем.
А непрофессионалов просим следовать за нами и не слишком скучать при обнаружении такого количества технических подробностей. Мы постараемся недолго…
Для этого нам придется познакомиться с основными компонентами поисковика.
Итак, поисковая система состоит из следующих частей:
Spider (паук) - это программа, которая скачивает веб-страницы и сохраняет их в базе данных поисковой системы.
Crawler (краулер, «путешествующий» паук) - программа, которая автоматически проходит по всем ссылкам, найденным на странице. Его задача - определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Краулер, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе.
Indexer (индексатор) - программа, которая анализирует веб-страницы, скачанные пауками.
Database (база данных) - это хранилище всех данных, которые поисковая система скачивает и анализирует. Иногда базу данных называют индексом поисковой системы.
Search results engine (система выдачи результатов) - извлекает результаты поиска из базы данных. Система выдачи результатов занимается ранжированием страниц. Она решает, какие страницы удовлетворяют запросу пользователя, и в каком порядке они должны быть отсортированы.
Web server (веб-сервер) - осуществляет взаимодействие между пользователем и остальными компонентами поисковой системы.
Теперь посмотрим более подробно, как именно поисковая система находит, обрабатывает и отображает информацию в соответствии с запросом.
Бродя по интернету, робот-паук обнаруживает неизвестный ему сайт. Скачав главную страницу, паук находит на ней все имеющиеся ссылки на другие страницы сайта. Проходя по ссылкам, паук скачивает и эти страницы. И так далее, пока не перестанет обнаруживать новые ссылки и новые страницы. Все найденное паук сохраняет в базе данных и дает команду индексатору приступить к обработке страниц. На этом работа паука закончена.
Перед тем как рассказать о работе индексатора, отвлечемся немного, чтобы сказать пару слов о том, из чего состоят страницы сайтов.
Для создания страниц сайта используется так называемый «язык разметки текста» - HTML (hypertext markup language). Он состоит из набора тэгов - специальных последовательностей символов, описывающих внешний вид и расположение текста и картинок на странице. Но кроме тэгов, отвечающих за отображение видимых элементов страницы, существуют «невидимые» тэги. Большинство из них нас сейчас не интересуют. Для поисковика важен тэг meta keywords. В нем прописывают слова, являющиеся ключевыми для этого сайта. Пишут их там непосредственно для того, чтобы поисковик их нашел.
Теперь мы можем вернуться к индексатору поисковика. Эта программа анализирует сохраненные в базе данных страницы сайта, определяет для себя, какие слова на этой странице являются ключевыми. Для поиска этих ключевых слов индексатор использует как метатэги, так и слова, каким-либо образом выделенные на странице (заголовки, жирный шрифт, курсив и т. п.). После этого все слова, которые индексатор счел ключевыми, он заносит в отдельную базу данных, где хранятся ключевые слова со всех найденных сайтов.
Затем начинает работать система выдачи результатов. В первую очередь, путем сложной обработки каждое из ключевых слов получает определенный рейтинг. Этот рейтинг зависит от многих факторов. Основными из них являются два: насколько часто это слово запрашивается при поиске и насколько популярен сайт, на страницах которого это слово присутствует.
Популярность сайта напрямую зависти от его посещаемости. И в первую очередь степень популярности сайта определяет, на каком месте в результатах поиска окажется страница сайта, содержащая искомое слово.
Если мы возьмем ник или ФИО из любого паспорта пользователя Евы.Ру и зададим их поиск в поисковой системе, мы увидим, что ссылка на еварушный паспорт окажется одной из первых в результатах поиска. Это произойдет потому, что Ева.Ру является одним из самых посещаемых сайтов рунета. При этом если мы уберем из паспорта все личные данные, в результатах поиска они еще будут какое-то время появляться. Дело в том, что эта информация уже имеется в базе данных поисковой системы. Раз попав в базу, она остается там до тех пор, пока поисковый робот-паук не зайдет еще раз на сайт и не скачает страницы уже без этих данных. А от одного посещения сайта пауком до другого может пройти и несколько месяцев.
Резюмируя, хочется подчеркнуть еще раз: нужно понимать, что информация, которая уже есть в базе данных поисковой системы, не удалится оттуда мгновенно, даже если исчезнет со страниц сайта, где она была найдена. Информация, выложенная в паспорте, через некоторое время будет доступна всем.
Никто не говорит, что за пользователями Ева.Ру ведется постоянный и неусыпный надзор. Мы не призываем немедленно очистить паспорта и больше никогда ничего туда не выкладывать. Боже упаси! Нужно лишь помнить об ответственности, которую вы берете на себя, размещая в паспорте личную информацию. Этой статьей мы только пытались намекнуть, что каждый человек - сам кузнечик своего счастья. А болтун, как известно… ну, вы знаете…;)
Названия и определения взяты из статьи "Общие принципы работы поисковых
систем"
Статья заняла третье место в конкурсе "Общие статьи"
Ссылки по теме
| Дата | Автор | Комментарий |
|---|---|---|
| 17.12 20:40 | Газетка | супер-статья |
| 17.12 21:19 | Линейка | Видимо, я совсем НЕпрофессионал. Может быть, с утра лучше усвоится... Ничего сложного, но мозг завис. |
| 17.12 22:00 | Матрёшка +++ | Интересно... |
| 18.12 01:39 | Васильковая мама - СВЕТА4КА | да читайте, завидуйте...:) |
| 18.12 02:03 | olichka83 | Надо будет распечатать и поизучать потом в спокойной обстановке :) Отличная статья! |
| 19.12 04:02 | shun | "Логин, пароль и e-mail являются конфиденциальной информацией, которую не могут видеть другие пользователи и гости сайта" за исключением некоторых глюков, когда скрытые e-mailы оказывались видны :) А по поводу "досье" я считаю, что раз уж я есть такой человек на свете и трачу свое время и силы в интернете, то должна хотя бы делать это от своего имени. Если кому-то приспичит собирать "досье", пусть собирает :) |
| 19.12 12:02 | Лика+ | даааааа...стоит наверное задуматься куда и что размещать. |
| 19.12 21:11 | Golomisik | Конечно, все подряд размещать не стоит, но если все время об этом думать, то до паранойи рукой подать...Уж очень навязчиво последнее время эта тема муссируется- к чему бы это? |
| 20.12 01:05 | yaskrava | быстренько в google и проверять...проверять... |
| 21.12 12:34 | Katy_Kas | Так что, граждане, все в ваших руках - можете слепить себе в Интернете по вашему желанию образ героя или злодея! И не забывайте, что Интернет читают ваши конкуренты и потенциальные работодатели. |
| 21.12 19:05 | Squaw | несколько лет назад я устроилась на работу в компанию, которая при проверке сведений о новом сотруднике искала всё, что связано с этим человеком, в интернете. И мне было слегка неловко, когда в Особый Отдел попал мой рассказ о родах... |
| 28.12 01:34 | baba-jaga | Дааа! Стоит задуматься! |
| 13.01 06:19 | ЛаРиСа | Я считала, что это всем и так понятно! Но статья хорошая и нужная |
| 23.01 22:05 | Лилу123 | Полностью согластна! |
| 02.02 09:05 | ЕlenaP | статья хорошая... |
| 20.02 14:51 | baggy | Ну что ж, будем надеется, что нас не сдадут... |
| 15.03 21:08 | feitch | всё логично:) мы сами решаем какую инфу о себе делаем доступной |
| 20.03 09:43 | nataandr | В настоящее время появилось много сайтов (плана одноклассники) где действительно про человека можно узнать слишком много. Все-таки не стоит выставлять свою личную жизнь на всеобщий показ. |
| 20.03 18:13 | три оськи | Стоит задуматься... |
| 30.03 20:23 | Регина86 | а вот теперь стоит задуматься. |
| 14.04 18:17 | Luchy | статья полезная:) |
| 19.04 12:12 | Регина86 | Мда, думаю думаю подумаю. |
| 23.04 14:30 | irissskaaa | Да уд, есть очем подумать...Спасибо |
| 03.05 10:47 | Зоя79 | Мне вроде прятаться не от кого... |
| 03.05 20:03 | fetch | Согласно, об этом не стоит забывать |
| 09.05 13:43 | Татьяна Осипова | Очень познавательная статья! Действительно, гуляя в просторах интернета, не следует забывать о бдительности!!! |
| 20.05 18:17 | Lenok S | Статья отличная, особенно для новичков!!! |
| 12.06 23:12 | bobteil | Статья хорошая.Все ясно написано. |
| 21.06 11:13 | Элен-1983 | Статья хорошая,но врятли ,кто-то покуситься на меня лично,я же не принцесса какая-нибудь)))А о себе информацию оставить надо немножко,для потомков хотябы) |
| 08.07 23:35 | НаСтЮшКа | Хорошая статья. |
| 25.07 15:51 | franci | хорошая статья |
| 31.07 16:50 | evadrim | согласно |
| 30.08 02:41 | zmira | хорошая статья |
| 16.09 16:39 | olik-7 | Да, статья заставляет о многом серьезно подумать. С одной стороны не хочется постороннего вмешательства в свою жизнь. С другой стороны…. кто-то из великих сказал, что вечно живут лишь те люди, жизнь которых описана в книгах. Может это наш шанс? :-) |
| 19.09 17:21 | Berezkina | неплохая статья, немного нового извлекла для себя! |
| 22.09 16:48 | monagua | задумалась.... |
| 08.10 20:48 | larissa-leit-1 | Статья нужная, заставляет подумать! |
| 30.10 23:02 | alnedana | Познавательная статья. Интересно. |
| 02.11 00:28 | ноля | Интересно, даёт задуматься. |
| 02.11 15:44 | galaes | Позновательно. и многим не лишне. |
| 15.12 19:45 | Вересаева | я всегда об этом догадывалась... спасибо за статью |
| 24.11 10:52 | Грот-мачта | Всегда полагала, что это самоочевидно. |
