Inscreva-se em boletins informativos de dados

Antes de entrar em MOOCs populares ou comprar livros recomendados na Amazon, comecei assinando vários boletins informativos de ciência de dados e engenharia de dados. No início, eu estava lendo cada artigo e fazendo anotações, mas com o tempo aprendi a reconhecer os links importantes compartilhados em vários boletins informativos e me concentrar em alguns. Os boletins informativos são ótimos para se manter atualizado com novas ferramentas, pesquisas acadêmicas e postagens de blogs populares compartilhadas por grandes gigantes da Internet (por exemplo, Google, Netflix, Spotify, Airbnb, Uber, etc).

Aqui estão alguns dos meus boletins informativos favoritos:

  • Resumo de ciência de dados de Tristan Handy: Tristan fornece seu próprio comentário sobre sua lista com curadoria de artigos de ciência de dados.
  • Data Science Weekly: Uma lista selecionada de artigos e postagens de blog relacionados à ciência de dados, IA e ML. Também considero as seções de Treinamento e Recursos uma coleção útil de tutoriais online.
  • Hacker Newsletter: Um boletim informativo semanal com artigos escolhidos a dedo da Hacker News. Não é específico de ciência de dados / engenharia, mas há uma seção dedicada a dados e código que são relevantes.
  • AI Weekly do VB: Reflexões de escritores da Venture Beat com uma coleção de artigos relacionados à IA.

Eu também assino Data Machina, The Analytics Dispatche AI Weekly.

Elabore seu próprio currículo de dados

Em seguida, dependendo do seu foco, você precisa criar seu currículo de ciência de dados, engenheiro de dados ou analista de dados. Isso pode incluir aprender a programar em Python ou R se você estiver mudando de carreira de uma função de não programação. Se o orçamento não for uma preocupação, junte-se a um bootcamp ou faça cursos na Udacity e Dataquest pode ser uma ótima opção para obter orientação online de especialistas do setor. No entanto, se você se preocupa com os preços como eu, pode optar por seguir os guias de código aberto para criar um currículo gratuito:

Uma ressalva aqui é que simplesmente fazer esses cursos não é suficiente. Eu geralmente descobri que a maioria dos cursos e tutoriais online enfocam o conhecimento básico (por exemplo, matemática, estatística, teorias) ou guias simplificados para percorrer um exemplo trivial. Isso é especialmente verdadeiro em big data, já que os tutoriais tendem a usar um subconjunto menor de dados para executar localmente em vez de percorrer uma configuração de produção completa na nuvem.

Para complementar a teoria com cenários realistas, sugiro juntar Kaggle e usando as ferramentas gratuitas do Google, como Colab para praticar o trabalho com grandes conjuntos de dados. Você também pode pesquisar repositórios Github de alunos Udacity para ver como um projeto de capstone pode ser.

Rede com especialistas gratuitamente

Qualquer guia de carreira diria que o networking é importante. Mas como encontrar especialistas do setor dispostos a serem mentores ou simplesmente responder a algumas perguntas? Antes da pandemia, uma opção era participar de encontros, mas essa oportunidade era amplamente limitada aos residentes em grandes centros de tecnologia como Bay Area, Nova York ou Seattle (pelo menos nos Estados Unidos). A outra opção era participar de conferências ou workshops focados em ciência de dados, aprendizado de máquina ou engenharia de dados. No entanto, os ingressos para esses eventos eram muito caros, tornando inviável o comparecimento de pessoas físicas sem o patrocínio da empresa.

Como funcionário de uma startup que mora em Baltimore, minha solução foi estabelecer uma rede online assistindo primeiro vídeos gratuitos de sessões realizadas por parceiros do setor em conferências de tecnologia (por exemplo, AWS re: Invent, Microsoft Ignite ou Google Cloud Next) e conectando-se com os palestrantes no LinkedIn . Além das palestras e das sessões sobre novos lançamentos de produtos em nuvem, há toneladas de sessões sobre as melhores práticas e discussões de arquitetura onde um gerente de produto ou um desenvolvedor líder de um parceiro da indústria (por exemplo, Lyft, Capital One, Comcast) apresentaria uma solução arquiteto da AWS / Azure / GCP na solução de um problema real em escala. Eu faria anotações sobre a sessão e, em seguida, falaria com todos os palestrantes do LinkedIn sobre o produto ou uma decisão arquitetônica mencionada na palestra. Surpreendentemente, quase todos os palestrantes estavam dispostos a responder e continuar a conversar comigo, embora eu fosse apenas um recém-formado trabalhando em uma startup desconhecida na época.

Com o tempo, minha rede cresceu de maneira constante e tive o benefício adicional de me manter atualizado com novos produtos e tendências do setor em todos os principais provedores de nuvem. Considerando a situação atual com o COVID-19 e a mudança contínua para eventos virtuais, isso pode se tornar a nova norma em networking, em vez de participar de conferências para encontrar outras partes interessadas pessoalmente.

Obter certificação

Embora as certificações em nuvem não sejam de forma alguma uma validação de capacidade ou conhecimento de dados, ainda acho que vale a pena investir em certificações. Isso é especialmente verdadeiro se você pretende ser um engenheiro de dados, pois o conhecimento da nuvem é fundamental para a execução de cargas de trabalho de produção. Mesmo para cientistas de dados, familiarizar-se com produtos em nuvem permite que você realmente se concentre na análise dos dados em vez de se esforçar para carregar e limpar os dados em escala.

Outro aspecto subestimado da certificação é a abertura da rede. Existem membros muito ativos no LinkedIn, especialmente em consultoria de tecnologia, postando sobre novas oportunidades em posições de dados em nuvem. Alguns recrutadores publicam diretamente em grupos do LinkedIn apenas para detentores de certificação. A certificação por si só não leva a um novo emprego ou posição, mas ter esses emblemas torna mais fácil iniciar uma conversa com outras pessoas ou recrutadores. Pessoalmente, consegui alguns pequenos projetos de consultoria depois de obter as certificações.

Resolva problemas reais

Finalmente, como em qualquer disciplina de engenharia, você só vai melhorar com a prática. Se você já está trabalhando como cientista ou engenheiro de dados, obter experiência no mundo real não deve ser um problema. Para outras pessoas que desejam fazer a transição, muitos recomendam a construção de um portfólio. Mas por onde você começa? Trabalhar com o conjunto de dados clássico do Titanic para classificação de sobrevivência ou agrupamento para o conjunto de dados da íris provavelmente prejudicará seu portfólio do que ajudá-lo.

Em vez disso, tente usar projetos públicos do Github como inspiração. Com base na rede que você acumulou no LinkedIn por meio de sessões de tecnologia e certificações, veja o que os outros estão construindo. Sinta-se à vontade para usar exemplos de projetos Udacity ou Coursera no Github. Em seguida, misture conjuntos de dados reais de Pesquisa Google, Kaggle, ou procure por um conjunto de dados interessante e comece a construir soluções para problemas reais.

Se você está interessado em um setor ou uma empresa específica, tente pesquisar conjuntos de dados públicos e construir um projeto de amostra. Por exemplo, se você estiver interessado em fintech, tente usar Dados de empréstimos públicos do Lending Club para construir um algoritmo de aprovação de empréstimo. A maior lição de trabalhar com conjuntos de dados reais é que eles são muito confusos e barulhentos em comparação com os fornecidos em ambientes acadêmicos.



Fonte: thenextweb.com

Deixe uma resposta