Arquivo da categoria: Data Science

Área de Dados, por onde começar?

Esse vídeo é uma Palestra que eu iria ministrar em Faculdades e Universidades do Ceará, só que devido a Pandemia do Coronavírus, tive que desmarcar alguns eventos e resolvi disponibilizar aqui!

Deixem seus comentários e caso tenham interesse, posso agendar uma live para tirarmos dúvidas relacionadas a palestra, o que acham? (deixem seus comentários lá no youtube)

Segue link para download da apresentação.

Segue vídeo
inicial

PROJETO DE LEI Nº 21/20 – Uso da Inteligência Artificial

Texto determina que a inteligência artificial deverá respeitar os direitos humanos e os valores democráticos.

O Projeto de Lei 21/20 cria o marco legal do desenvolvimento e uso da Inteligência Artificial (IA) pelo poder público, por empresas, entidades diversas e pessoas físicas. O texto, em tramitação na Câmara dos Deputados, estabelece princípios, direitos, deveres e instrumentos de governança para a IA.

Visualize o Projeto de Lei 21/20

Continuar lendo PROJETO DE LEI Nº 21/20 – Uso da Inteligência Artificial

Aprendendo DATA SCIENCE

Este material apresenta um conjunto de POST´s relacionados a Machine Learning, onde iremos começar vendo conceitos, cenários e previsões para a IA, alguns conceitos básicos de Estatística. Em seguida iremos mostrar algumas ferramentas que nos auxiliam no dia a dia quando trabalhamos com Machine Learning. Veremos também uma breve descrição sobre Dados e Big Data, passando por Bancos de Dados não Relacionais (NOSQL).

Após essa base, entraremos no assunto principal: Machine Learning, onde será mostrado diversos materiais detalhando Algoritmos, técnicas, bibliotecas (librarys) e etc, onde daremos um foco maior para Algoritmos de Classificação e Natural Language Processing (NLP) e por fim, Métricas que podem ser aplicadas.

Em seguida, falaremos sobre Ciência de Dados (Data Science), explicação do que é, o que faz um Cientista de Dados (data scientist), ferramentas utilizadas, uma POST com diversos vídeos que mostram as técnicas e ferramentas utilizadas no dia a dia de um Cientista de Dados.

No final, veremos algumas aplicações utilizando Machine Learning.

É isso, espero que gostem da compilação de post´s, e possa possa lhe ajudar de alguma forma em seus estudos! Esse post será constantemente atualizado e conto com o feedback de todos para que possamos melhorar ainda mais esse material. Se quiserem sugerir artigos, podem sugerir que adiciono aqui, a ideia é ser uma fonte de estudos.

Continuar lendo Aprendendo DATA SCIENCE

GitHub

Em um nível elevado, o GitHub é um site e serviço baseado em nuvem que ajuda os desenvolvedores a armazenar e gerenciar o seu código, rastreando e controlando também as alterações nos seus códigos. Para saber exatamente o que é o GitHub, você precisa conhecer dois princípios interligados que serão detalhados a seguir, após o detalhamento, um vídeo demonstrando o funcionamento do GitHub, não percam:

  • Controle de versão
  • Git

Continuar lendo GitHub

Aprenda Data Science com o Minerando Dados

Coletânea de Vídeos do Canal Minerando Dados, material de excelente qualidade e didática fácil. Parabéns Felipe e Rodrigo Santana. Confiram!

Série de Vídeos de Mentoria para Data Science

Mentoria Evolution Aula 10

Mentoria Evolution Aula 09

Continuar lendo Aprenda Data Science com o Minerando Dados

TOP 10 Posts +1 sobre NLP de 2019…

Tempo de Leitura: 5 minutos

Natural-Language-Processing-03-1

Compartilhando com vocês os “TOP 10 artigos sobre NLP (Natural Language Processing) de 2019, isto é, os Posts que publiquei em 2019 e que teve maiores audiências. Espero que gostem dessa relação e que alguns destes possam ser úteis no seu dia a dia, caso ainda não tenha visto. Vamos lá…

#10 – LUPPAR NEWS-REC (RECOMENDADOR INTELIGENTE DE NOTÍCIAS)

Luppar News-Rec (Versão 1) é fruto da minha dissertação de Mestrado! É um Sistema Recomendador de Notícias (SRN) composto por algoritmos clássicos de classificação que trabalham em conjunto com representações de documentos para solucionar o problema de classificação de notícias de forma a trazer os documentos(notícias) que atendam a necessidade do usuário.

#9 – AVANÇANDO O PROCESSAMENTO DE LINGUAGEM NATURAL (NLP) PARA DOMÍNIOS CORPORATIVOS

O processamento de linguagem natural (do inglêsNatural Language Processing – NLP) é uma grande promessa para ajudar a encontrar informações tão profundas no conteúdo da empresa, permitindo que os usuários expressem mais livremente suas necessidades de informações e fornecendo respostas precisas para perguntas cada vez mais complexas. No entanto, os sistemas empresariais de NLP são frequentemente desafiados por vários fatores, que incluem compreender silos heterogêneos de informações, lidar com dados incompletos, treinar modelos precisos a partir de pequenas quantidades de dados e navegar em um ambiente em mudança no qual novos conteúdos, produtos, termos e outras informações são continuamente adicionadas.

Continuar lendo TOP 10 Posts +1 sobre NLP de 2019…

Classificação desequilibrada (Imbalanced Classification)

Matéria original e todos direitos reservados ao autor: Standard Machine Learning Datasets for Imbalanced Classification escrito por Jason Brownlee

Segundo Jason Brownlee, um problema de classificação desequilibrada (Imbalanced Classification) é um problema que envolve a previsão de um rótulo de classe em que a distribuição de rótulos de classe no conjunto de dados de treinamento é distorcida.

Muitos problemas de classificação do mundo real têm uma distribuição de classes desequilibrada; portanto, é importante que os profissionais de aprendizado de máquina se familiarizem com o trabalho com esses tipos de problemas.

Todos os códigos fonte podem ser encontrados nesse link do GitHub…
Façam os devidos testes…

Visão geral

Este tutorial está dividido em três partes; eles são:

  1. Conjuntos de dados de classificação binária (Binary Classification Datasets)
  2. Conjuntos de dados de classificação multiclasse (Multiclass Classification Datasets)
  3. Competição e outros conjuntos de dados (Competition and Other Datasets)

Continuar lendo Classificação desequilibrada (Imbalanced Classification)

O cenário de dados e IA de 2019

Segundo Matt Turck, em seu artigo original – aqui traduzido, disse que 2019:

Foi outro ano intenso no mundo dos dados, cheio de emoção, mas também de complexidade.

À medida que mais mundo fica on-line, a “informação de dados” de tudo continua a acelerar. Essa mega-tendência continua ganhando força, alimentada pela interseção de avanços separados em infraestrutura, computação em nuvem, inteligência artificial, código aberto e a digitalização geral de nossas economias e vidas.

Alguns anos atrás, a discussão sobre “Big Data” era principalmente técnica, centrada no surgimento de uma nova geração de ferramentas para coletar, processar e analisar grandes quantidades de dados. Muitas dessas tecnologias agora são bem compreendidas e implantadas em escala. Além disso, nos últimos dois anos, em particular, começamos a adicionar camadas de inteligência por meio de ciência de dados, aprendizado de máquina e IA em muitos aplicativos, que agora estão cada vez mais em produção em todos os tipos de produtos de consumo e B2B.

À medida que essas tecnologias continuam melhorando e se expandindo além do grupo inicial de adotantes (FAANG e startups) para a economia e o mundo em geral, a discussão está mudando do puramente técnico para uma conversa necessária sobre o impacto em nossas economias, sociedades e vidas.

Estamos apenas começando a realmente entender a natureza da interrupção à frente . Em um mundo em que a automação orientada a dados se torna a regra (produtos automatizados, carros automatizados, empresas automatizadas), qual é a nova natureza do trabalho? Como lidamos com o impacto social? Como pensamos em privacidade, segurança, liberdade?

Enquanto isso, as tecnologias subjacentes continuam a evoluir em ritmo acelerado, com um ecossistema sempre vibrante de startups, produtos e projetos, anunciando talvez mudanças ainda mais profundas pela frente. Nesse ecossistema, o ano foi caracterizado pelas primeiras entradas de uma consolidação esperada, e talvez pela passagem da guarda de uma época para outra, à medida que as primeiras tecnologias começaram a dar lugar à próxima geração.

Para tentar entender tudo isso, esta é a nossa sexta paisagem e o “estado da união” dos dados e do ecossistema de IA. Para quem estiver interessado em acompanhar a evolução, aqui estão as versões anteriores: 2012 , 2014 , 2016 , 2017 e 2018 .

Continuar lendo O cenário de dados e IA de 2019

Artificial Intelligence Index – Report 2019

O AI Index Report rastreia, coleta, destila e visualiza dados relacionados à inteligência artificial. Sua missão é fornecer dados imparciais e rigorosamente examinados para que formuladores de políticas, pesquisadores, executivos, jornalistas e o público em geral desenvolvam intuições sobre o campo complexo da IA. Expandindo anualmente, o Relatório procura incluir dados sobre o desenvolvimento da IA de comunidades em todo o mundo.

Visualize clicando na imagem abaixo, ou no link.

IAIndex2019

 

120 previsões da IA ​​para 2020

Uma tradução – do Google – do artigo: 120 AI Predictions For 2020 escrito por: Gil Press (todos os direitos reservados ao autor)

Vejam também: 99 (Extra!) AI Predictions For 2020


Gil Press: “Alexa, me diga o que acontecerá em 2020.”

Amazon AI: “Eis o que encontrei na Wikipedia: O Campeonato da Europa de Futebol da UEFA 2020 … [continua a ler na Wikipedia]”

Gil Press: “Alexa, me dê uma previsão para 2020.”

Amazon AI: “O universo não me revelou a resposta.”

Bem, houve uma ligeira melhora em relação às respostas do ano passado , quando a resposta da Alexa à primeira pergunta foi: “Você deseja abrir ‘este dia na história’?”. Quanto ao universo, é um livro aberto para os 120 executivos seniores apresentados aqui, todos envolvidos com a IA, fornecendo previsões para 2020 para uma ampla gama de tópicos: veículos autônomos, deepfakes, pequenos dados, processamento de voz e linguagem natural, inteligência humana e aumentada, tendência e explicabilidade, processamento de borda e IoT e muitas aplicações promissoras de inteligência artificial e tecnologias e ferramentas de aprendizado de máquina.

Continuar lendo 120 previsões da IA ​​para 2020