O que é o Kaggle? O guia completo!

kaggle

Compartilhe esse post

O Kaggle é um excelente recurso para pessoas que são iniciantes em ciência de dados e aprendizado de máquina, se você é uma delas, então você está definitivamente no lugar certo 🙂

0. Introdução

Antes de ir para o Kaggle , gostaria de enfatizar que é uma boa ideia ter uma base sólida primeiro. Se você gostaria de saber mais, aconselho dar alguma lida sobre conceitos básicos de ciencia de dados, aconselho também a dar uma lida nos nossos posts e nossos cursos aqui no site.

1. Conjuntos de Dados

Para começar, sugiro que você comece observando os conjuntos de dados, Datasets | O chato aqui é que não há realmente nenhuma maneira de coletar (da própria página) quais conjuntos de dados são bons para começar. Eu recomendaria usar o recurso de “pesquisa” para procurar alguns dos conjuntos de dados padrão, como os conjuntos de dados Iris Species , Pima Indians Diabetes , Adult Census Income, autompg e Breast Cancer Wisconsin .

kaggle

Antes de prosseguir, leia as descrições do conjunto de dados para entender o que exatamente as variáveis ​​indicam e o que os dados significam.

 

2. Kernels

Não é só para ver banco de dados que você veio ao kaggle, certo? Então confira a guia “Kernels” e clique em uma das entradas que você vê na tela seguinte:

kaggle
kaggle

Os kernels são “editores de scripts on-line que permitem executar código sem instalar o R ​​ou o Python (e os dados já estão conectados)”. – Em outras palavras, você pode continuar trabalhando no seu navegador e explorar, modelar, visualizar,… seus dados sem ter que instalar nada.

Quando você clica na primeira entrada, por exemplo, você verá algo como isto:

Eu diria, inspecione qualquer kernel que você tenha selecionado, e tente obter a idéia geral por trás dos kernels que acabei de descrever – A maneira mais fácil de fazer isso é bifurcando o kernel que você selecionou pressionando o botão azul “Fork Notebook” . Você será solicitado a efetuar login (se ainda não estiver logado) e será levado ao editor:

Você pode começar a fazer ajustes: alterar o código, alterar o texto, adicionar imagens,…

Depois de ter bifurcado e ajustado o notebook, você pode começar a fazer seus próprios cadernos e scripts do zero, pressionando o botão azul “Novo Kernel” (você pode ver a diferença entre essas duas opções na imagem abaixo):

Se você gostaria de ter alguma ajuda para começar a usar os scripts do Kaggle, confira o Exploração de dados com scripts do Kaggle .

Um recurso que eu não destaquei antes, é o fato de você poder discutir os cadernos, scripts, conjuntos de dados, dentro das páginas que mostrei as imagens! Esse é um recurso bastante útil quando você está tentando entender o que e por que as pessoas estão fazendo as coisas que fazem em seus cadernos / scripts ou para obter esclarecimentos sobre os dados ou por que os dados parecem da maneira que parecem. Quaisquer comentários que você tenha, você pode resolvê-los imediatamente!

 

3. Discussão

Além da opção de comentar, você também tem uma seção de discussão inteira à sua disposição, completa com um fórum Kaggle, uma seção dedicada aos iniciantes para começar, feedback do produto. Você deve definitivamente ir e dar uma olhada quando tiver a chance!

kaggle

4. Blog

Kaggle também tem um blog com alguns tutoriais, anúncios. Isso também pode ser útil para você verificar, mas eu tenho que mencionar que você também pode encontrar bons tutoriais em outros lugares, como a documentação de bibliotecas Python / R, Machine Aprendizado (Chris Albon), Construa melhor o software, juntos (Github).

5. Competições

É uma das primeiras coisas que você vê quando entra no site: as competições. Quando você já trabalhou com os kernels e os conjuntos de dados, é uma boa ideia entrar nas competições.

kaggle
Ao fazer isso, confira os seguintes cursos interativos gratuitos que ajudarão você a começar:

Também confira as competições “Getting Started” no próprio Kaggle.

6. Ranking de Usuários

Você sempre pode aprender com os melhores. Confira o ranking de usuários para ver o que você precisa fazer para se tornar um mestre de Kaggle !

7. Empregos

Algo que você pode querer verificar enquanto estiver trabalhando no Kaggle é a seção de empregos. Isso é perfeito para aqueles que ainda estão procurando emprego na indústria de ciência de dados!

Espero que você tenha gostado!

Inscreva-se

Seja atualizado e aprenda com os melhores

Mais para explorar

100 perguntas htm eng

Master the data science interview 100 MOST COMMON QUESTIONS AND ANSWERS ASKED IN INTERVIEWS – A COMPLETE GUIDE TO BOOST YOUR CAREER Yes, I want! BECOME A DATA SCIENTIST Data Science is revolutionizing the world of business and technology. With our eBook “Master Data Science: A Complete Guide to Boost Your Career,” you will have access to comprehensive content that will help you enter and thrive in this promising field.   WHAT WILL YOU LEARN? Fundamentals of Statistics and Probability Databases and SQL Python for Data Analysis Machine Learning and its Algorithms Natural Language Processing and its Applications Data Visualization and Design Big Data and Related Tools Feature Engineering and Model Selection Purchase the eBook now and receive Over 200 pages of high-quality content Explanations and examples Tips to improve your skills and increase your chances in interviews INVEST IN YOUR FUTURE Don’t miss this opportunity to deepen your knowledge and stand out in the job market. Purchase the eBook “Master Data Science: A Complete Guide to Boost Your Career” right now and start your journey towards success in the field of Data Science! TAKE ADVANTAGE OF THE PROMOTION ONLY $ 9,99 Yes, i want

100 perguntas htm

domine a entrevista de ciencia de dados 100 perguntas e respostas mais frequentes feitas em entrevistas – um guia completo para impulsionar sua carreira Eu quero seja um cientista de dados   A Ciência de Dados está revolucionando o mundo dos negócios e da tecnologia. Com nosso eBook “Domine a Ciência de Dados: Um Guia Completo para Impulsionar sua Carreira”, você terá acesso a um conteúdo abrangente que o ajudará a ingressar e prosperar nesta área promissora. o que você vai aprender? Fundamentos da Estatística e Probabilidade Bancos de Dados e SQL Python para Análise de Dados Aprendizado de Máquina e seus Algoritmos Processamento de Linguagem Natural e suas Aplicações Visualização de Dados e Design Big Data e Ferramentas Relacionadas Engenharia de Recursos e Seleção de Modelos Adquira o eBook agora e receba   Mias de 200 páginas de conteúdo de alta qualidade   Explicações e exemplos   Dicas para aprimorar suas habilidades e aumentar suas chances em entrevistas invista no seu futuro   Não perca esta oportunidade de aprofundar seus conhecimentos e se destacar no mercado de trabalho. Adquira o eBook “Domine a Ciência de Dados: Um Guia Completo para Impulsionar sua Carreira” agora mesmo e comece sua jornada rumo ao sucesso na área de Ciência de Dados! aproveite a promoção Condições parceladas APENAS R$ 27,90 EU QUERO