Школа
79

Биг дата- с чего начать?

Я домохозяйка, сто лет назад закончила ВМиК. Чуть поработала в продажах, потом декрет и засела дома. Сейчас брак трещит по швам, надо готовить пути отступления. Искать работу и тому подобное.
Узнала, что бигдатистам-датасаентистам хорошо платят. Как думаете, возьмут тетю 40 лет джуном?
И с чего начать, что учить? Нашла курсы на степике, курсере, вспоминаю матстат, питон начала учить, а что еще надо?

Свернуть
Ответить
Найдите форум, где они тусят, и задайте эти самые вопросы. 9 Вас пошлют, десятый ответит по сути )))
Ответить
Вы сначала с этим новомодным течением нас ознакомьте вкратце. В принципе можно и самим в нете почитать, но интересна именно ваша трактовка своими словами...
Ответить
Это старое течение, новое название плюс новые подходы.
Ответить
Способы получения информации из цифровых данных. Ничего нового
Ответить
Неверно. Это не только цифровые данные. Это вообще все данные.
Ответить
Привидите пример нецифровых данных, из которых сейчас без отцифровывания извлекают информацию? И чтобы это называли бигдатой?
Ответить
Транцакции, например, лет за 5. Онлайновый браузинг. Онлайновое или физическое казино транзакции - это все биг дата, и только одни из примеров.
Ответить
Это примеры НЕЦИФРОВЫХ данных?
Ответить
транзакции вы называете digital data? Ну возможно, если формально.
Ответить
Биг дата - цифровые, но неструктурированные данные. Транзакции, если на бумаге написаны - то нецифровые, а если в файле набиты - то цифоровые. Делов-то :)
Ответить
Структурированные тоже к ней относятся.
Ответить
Зависит от первого диплома. Матстат, теорвер, А И ТЧ норм? Пробуйте сразу АI. Больше платят и интересно.
Ответить
Пробуйте сейчас, как есть, устраиваться в какое-нибудь маркетинговое агентство. Я тоже закончила ВМК, мне друзья, работающие в этом, рассказывают периодически, что нужны надежные грамотные люди, которые могут к сроку делать простые операции с массивами данных. Даже просто в Excel. Но аккуратно. И не такие, что через два месяца уволятся. И проблема их найти, с адекватными запросами. У вас даже преимущество есть.
И проблема есть, приходят соискатели с дипломом "прикладная математика" и не могут тестовую задачку решить.
Начнете работать, по ходу дела проще будет осваиваться и повышать квалификацию.
Но вообще, от этих же друзей я слыхала, что потолок в этой отрасли довольно низкий, по сравнению с другими вариантами для выпускника ВМК
Ответить
а что такое бигдата?... я походу отстала от жизни)и что такое джун?)
Ответить
Если вы знаете статистику все ещё и можете писать на питоне то могут и взять. Так что начните с питона. А ещё можете изучить скалу.
Ответить
смотря где вы и в какой компании собираетесь работать . Я использую R, octave. Пайтон наверное лучше всех.
Ответить
Смотря для чего.
Anonymous
24.04 19:35
Смотря для чего.
Ответить
Я В Москве. Про компанию не знаю, куда возьмут. Думаю, у нас устроиться немолодой тете в ИТ и в высокооплачиваемую сферу сложно. Подруга работает в Германии, она самая молодая в отделе (ей 44, биг датой и занимается).
Ответить
Я тоже в Европе и относительно недавно освоила эту тему. Не могу сказать про Москву. У нас Пайтон рулит у всех аналитиков. Но вы ищите, почему нет? тем более, если есть еще какие-то скиллы и сможете совместить их. Я занимаюсь маркетингом, аналитикой и датой. мне нравится очень, я не сижу с утра до ночи кодируя, но визуализирую свои находки и прогнозы.
Ответить
А подруга что-то советует, что учить нужно?
Ответить
Просматривайте объявления о работе, что чаще всего встречается в требованиях, то и учите.
Ответить
А потом? Какой резон брать тетю после курсов без опыта?
Ответить
Тетя не спрашивала, возьмут ее или нет, а спрашивала как максимизировать шансы на то что ее возьмут. Я ответила. Понятно, что без опыта сначала можно претендовать на меньшую зарплату, но где-то же надо начинать.
Ответить
+ много..
Главное начать.. :)
Ответить
Такую тетю возьмут скорее рано, чем поздно ))) Старый ВМК это марка и тетя адекватно оценивает свое положение.
Ответить
Смотрела сейчас работу ребенку на лето (вакансии 14-17 лет), нашла вот что.
https://hh.ru/vacancy/31141647
Хотя очень странно, почему этот координатор может быть в 14 лет. Nakamoto terminal, судя по всему, реально существует и вполне себе интересная платформа bigdata
Ответить
Я бы еще SQL добавила...
Ответить
Тогда и джаву, и хайвз.
Ответить
Этим никогда не пользовалась. А Python, SQL и Tableau вполне.
Но я и не совсем Data Analytic.
Ответить
Разговор то про биг дату. А это может быть и хадуп, и тогда сиквел не поможет, нужно хайвз запросы писать.
Ответить
А что такое хайвз?
Бешеная белка D
25.04 13:24
А что такое хайвз?
Ответить
Хайв это такая хрень, которая сидит на хадупе, позволяет вытаскивать из хадупа данные, и язык похож на сиквел.
Ответить
Спасибо, покопаюсь на досуге для общего развития
Ответить
Если английский знаете, идите на datacamp. Курсы платные, но для меня они показались самыми понятными для обучения (можно в инете поискать купон на 2 мес. бесплатного доступа). Хотя есть куча бесплатных на coursera, udacity, edx.
Ответить
Спасибо огромное!
Домокозявка
24.04 23:36
Спасибо огромное!
Ответить
Легко. Резюме работодателям направьте.
Ответить
Это крайне унылая работа.
Большую часть времени ты сидишь и пытаешься сопоставить данные, преобразуешь данные из одного формата в другой, муторно очищаешь их от неправильно введенных значений, пытаешься бороться с источниками данных. Боль и страдание
Большинство думает, что это высокоаналитическая работа, а в итоге бигдатисты занимаются первичной обработкой данных. Один шарит - строит графики, а остальные 10 говна разгребают, подчищают данные для него
И перейти из десятки в того одного аналитика практически невозможно. Разные уровни и они практически не пересекаются
Ответить
Видимо, везде по-разному. У нас этим data engineers занимаются. Data Scientists и Data Analytics уже с готовыми массивами работают.
Ответить
В итоге 80% времени-багафикс. И так везде:-) Оклад радует,но печааааааль.
Ответить
Просто вы оказались на такой работе, к аналитике не имеющей ни малейшего отношения. Но автор с ее отсутствием опыта скорее всего тоже только на такую и сможет претендовать.
Ответить
Просто я Quant developer в hedgefond, хорошо знаю 4-5 языков, знакома еще с десятком. И знаю, чем в основном занимаются люди по теме топа. Пропорции занятых на интересной работе в этой сфере указала сразу.
Ответить
Извините, но вы напрасно пальцы растопыриваете. Вы много знаете, но только в своей области. Очень узкой, надо сказать.
Работать интересно - зависит от того, кто хочет работать.
Ответить
Нет, это вы уже второй раз делаете произвольные выводы, ошибаясь с ними, и даете свою эмоциональную окраску)
Ответить
Просто разный опыт. Но вы априори считаете свой опыт более обширным.
Ответить
Естественно. Я же знаю, чем я занималась до этого, и на какие места с какими задачами регулярно собеседуюсь, чтобы продолжать быть конкурентоспособной.
А вы мой отзыв по теме приравняли к моему основному роду деятельности)
Вокруг бигдата много хайпа, много шума. Многие люди сделали выводы, что там деньги и идут этим заниматься. Другие решают, что им это очень надо, затрачиваются. Хотя часто проще нанять двух индусов и они тихо все сделают ручками
Ответить
С этим соглашусь. Просто переименовали то, что было всегда, просто расширились возможности. Но интересного и раньше, и сейчас был небольшой процент. При желании к этому небольшому проценту можно подобраться, но с нуля как у автора это практически не возможно.
Ответить
Да, именно в этом дело, в ситуции автора. Дата аналитики это считай элита. Без опыта, правильного образования и связей в этой сфере туда никто не доберется. Одного профильного образования недостаточно. Нужно знать свою сферу, например, финансы. Я изначально описала то, чем занимаются дата инженеры, я это вижу каждый день
Ответить
боже мой, я вообще не в курсе что это за работа такая..кроме статистики ничего не поняла
Ответить
Это не работа. Это буквально много данных. И с ними можно делать работу, разную. Можно даже в экселе считать и это тоже будет работа с биг датой. Можно быть дата сайнтистом и работать с биг датой, использую эксель и /или разные языки программирования. Применяется во всех индустриях почти.
Ответить
https://t.me/datajobschannel идите туда и читайте, там пасутся русскоязычные спецы по биг дате, из разных стран, городов и весей.
Ответить
муж в банке возглавляет отдел машинного обучения ( искуственный интеллект). на основе больших данных строят модели. у него в подчинении много датасантистов. если без опыта, то берут студентов определенных ВУЗов после 4 курса. примерно за 3 месяца ( максимум полгода) люди вполне себе неплохо работают. Но у них есть система наставничества. также все проходят курсы ( в банке это бесплатно). знаю точно Питон на курсах есть и тд.
Ответить
А из каких вузов берут? Сын собирается поступать в Финансовую Академию на факультет IT. Якобы оттуда как раз в банки идут работать. Не могли бы вы спросить у мужа, как у них Финакадемия котируется?
Ответить
уточнила: МГУ (мех мат, вмк), МИФИ, вышка и все топовые технические вузы. также их банк курирует несколько кафедр в вузах.
Ответить
Спасибо!
Manysha OH*
27.04 20:33
Спасибо!
Ответить
Умоляю, расскажите в чем заключается эта работа биг дата. Только языком, понятным обыватежю, прям на пальцах. Я столько раз гуглила, но так и не смогла понять что конкретно они делают, какой конечный продукт и кто им пользуется.
Ответить
Выше все на пальцах объяснено. У вас есть техническое образование?
Ответить
Обрабатывают информацию. Грубо говоря, это прогнозирование основанное ислучительно на измерениях (статистике), а не на теории. Например, рассылая рекламу детективмого романа вы можете делать это двумя способами:
1. Основываясь на теории - те кто любят детективы (или автора романа), купят и этот детектив.
2. Посмотреть положительные отзывы о романе, собрать информацию о книгах которые были куплены людьми оставившими положительные отзывы и разослать рекламу тем кто купил те же книги что и люди оставившие положительные отзывы. Это будет биг дата.
Смысл биг даты в том что она не пытается найти ответ на вопрос "почему", а просто тупо использует доступную информацию.
Ответить
Представляете, и на вопросы почем тоже прекрасно дает ответы. И вовсе не тупо.
Ответить
Представляю, потому что с этим работаю. Может дать, а может и не дать. Смысл БД не в этом.
Ответить
Смысл и в этом тоже. Смысл в том чтобы эти данные дали ответы на вопросы, которые бизнес задает. А не в том, что она может быть может дать.
Ответить
Ответить на вопрос “Почему?» -это и есть главная задача Data Scientist ))
Ответить
Почему что, простите? ДС занимаются алгоритмами сбора и обработки информации. А уж как эта информация будет использована, зависит от типа данных. Смысл БД в возможности использования прямого потока данных вместо теории основаной на выборках.
Ответить
ДС занимаются алгоритмами сбора и обработки информации - это вы, по-моему, путаете с Data Engineers.
Как варианты задач для Data Scientists - более точное предложение продуктов и услуг для потребителей, поиск причинно-следственных связей в поведении клиентов.
Ответить
Нет, я не путаю. ДС это по сути очень продвинутый ДЕ. ДС занимаются именно разработкой методов. А ДЕ выполняют "черную" работу.
Анализом данных занимаются те, кому эти данные предназначаются. Например в моем случае это геологи и геофизики. Моя подруга работает с языками, поэтому в ее случае это переводчики и лингвисты.
Вся идея БД заключается как раз в том, что вам не нужно искать причинно-следственные связи. Это дает возможность быстро и правильно реагировать не углубляясь в проблему. Например, если вы видите что 50% людей купивших в вашем магазине желтые носки, купили еще и красную кепку, вы положите эти носки рядом с кепкой и разошлете рекламу кепки владельцам желтых носков. Почему любителям желтых носков нравятся красные кепки, вас не волнует совершенно.
Ответить
Анализом данных и занимаются статистики, дата сайнтисты.
А вопрос почему в вашем случае вообще не имеет смысла. А вот вопрос почему любители желтых носков перестали покупать желтые носки - очень даже имеет. И на него можно дать ответ. Это тоже важно.
Ответить
Анализом КАКИХ данных занимаются статистики? БД активно применяется в медицине, нефтяной и металлургической промышленности, автоматизированных переводах и еще куче областей. Как сайнтисты могут заниматься анализом этой информации?
БД не ответит вам на вопрос почему любители желтых носков их разлюбили. Вы теорию Вообще учили? Определение БД помните? Как только вы отделяете любителей желтых носков от всэ остальных, сортируете их и начинаете строить теории на тему "почему", вы уходите из области БД и перэодите в область анализа данных и статистики.
Ответить
Не знаю уж, как вам объяснить как они могут заниматься анализом - так вот и занимаются.
"БД не ответит вам на вопрос почему любители желтых носков их разлюбили. " - ответит. Я этим занимаюсь.
"Вы теорию Вообще учили? " - я 15 лет занимаюсь на практике, разрабатываю и применяю.
"вы уходите из области БД и перэодите в область анализа данных и статистики." - когда говорят про биг дату, в том числе подразумевают и анализ этой биг даты. А как там установить хадуб или сиквел сервер - это инженеры и архитекторы, их не называют специалистами по биг дате.
Ответить
Ну ват я тоже не знаю как ваши ДС занимаются анализом геологических пород, реакций елементарных частиц и переводов стихов. Даже представить себе не могу.
А теорию все-таки почитайте. В той же википедии в англ варианте все овхень хорошо расписано. В том числе про причинно-следственные связи, которые для БД не являются обязательным элементом прогнозирования.
Ответить
Переводом стихов тоже можно заниматься, кстати. Я могу представить, Вы нет - пока мало опыта и практики.
У меня с теорией все прекрасно. И с практикой тоже. Это моя профессия.
Ответить
Ну вот как то это совершенно незаметно по вашим ответам, которые упираются в одну единственную отрасль использования БД, а именно - деньги.
Ответить
Девушка, вам не заметно, потому что я не пытаюсь вам тут показать, как я знаю теорию :). Вы, по-видимому, учитесь, да?
Причем здесь деньги? Вы имеете в виду прибыль? Да, переводить стихи тоже можно с целью прибыли. И ответить на вопрос почему не хотят покупать желтые носки - это прежде всего приводит к прибыли. И это очень важно ответить на этот вопрос.
Ответить
Нет, я как раз работаю. Конкретно пейчас пытаюсь выжать информацию из акустических данных и измерений температуры, давления и плотности, в то время как наш дата сайнтист пытается придать этим данным удобоваримый вид.
Ответить
Просто у вас так названы должности :).
Ответить
Не. ДС занимается анализом данных ( с применением алгоритмов) чтобы отвечать на подобные вопросы. Это их задача тоже найти ответы, чтобы их потом можно было использовать.
Можно и на прямом потоке данных, можно и на одноразовой выборке. Это все ДС. Раньше это называлось просто Advanced Analytics.
Ответить
Теперь понятно откуда берется спам :)
Ответить
Да, это машин лернинг в действии. Но это только одно из применений.
Ответить
Если на пальцах, то Бигдата занимается обработкой массивов информации для последующей генерации и рассылки спама, якобы ориентированного на конкретного потребителя.
Ответить
Нет, это только сегмент, в котором она тоже используется
Ответить

© Eva.ru, 2002-2025. 18+ Все права на материалы, размещенные на сайте, защищены законодательством об авторском праве и смежных правах и не могут быть воспроизведены или каким либо образом использованы без письменного разрешения правообладателя и проставления активной ссылки на главную страницу портала Ева.Ру (www.eva.ru) рядом с использованными материалами. За содержание рекламных материалов редакция ответственности не несет. Свидетельство о регистрации СМИ Эл №ФС77-36354 от 22 мая 2009 г. выдано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор) v.3.4.325 (nbww73hg8uzroxc8)