banner

Блог

Dec 09, 2023

Сила SQL для будущих специалистов по данным

История только для участников

Миган Вуло

Следовать

DataDrivenИнвестор

--

Делиться

Мой переход в мир науки о данных был нетрадиционным. Я пошел на факультет психологии, начал работать в сфере маркетинга, подрабатывал писательством и, наконец, записался на BootCamp по науке о данных, когда мне было 27 лет. Тем не менее, я относился к своему BootCamp по науке о данных в Springboard как к работе на полный рабочий день.

Я тратил не менее 40 часов в неделю на выполнение курсовой работы и проведение дополнительных исследований, чтобы лучше понять концепции. Но даже после окончания этой программы я не чувствовал себя полностью готовым получить работу специалиста по данным. Вместо этого я искал должности аналитика данных и аналитика маркетинга. Получив свою первую должность аналитика данных, я узнал, что, хотя я достаточно хорошо разбираюсь в Python, исследовательском анализе данных и моделировании, у меня нет четкого понимания запросов к данным.

Чтобы устранить этот недостаток, я искал ресурсы для практики SQL. Оглядываясь назад, я понимаю, что это, наверное, лучшее, что я мог сделать после окончания учебного курса по науке о данных с интенсивным изучением Python. Для тех, кто пытается начать карьеру специалиста по данным, я обнаружил, что есть очень веская причина изучить SQL — с ним вы незаменимы…

Вы можете подумать, что я преувеличиваю, но это правда. На современном рынке труда нет ничего однозначного. Увольнения технических специалистов происходят направо и налево без всякой причины и причины. Как человек, которого беспокоят подобные вещи, я поставил перед собой цель, над достижением которой я решил, что это станет моим билетом к гарантированной занятости… стать лучшим аналитиком данных в моей компании.

Для этого я решил, что мне нужно не только знать Python, но и хорошо владеть SQL. Вот мои рассуждения:

Если я могу получить свои собственные данные, мне не нужно полагаться на аналитика или инженера, чтобы получить информацию, необходимую для моих соответствующих моделей обучения.

Чаще всего люди знают правило науки о данных 80/20, которое гласит, что 80% науки о данных подготавливают данные, а 20% фактически анализируют и составляют отчеты. Конечно, часть этой очистки данных можно выполнить с помощью Python, но, хорошо разбираясь в SQL, я гарантировал, что смогу управлять данными, проверять их на наличие несоответствий и ошибок и очищать их, прежде чем заносить их в свой блокнот.

ДЕЛИТЬСЯ