Arquivo da categoria: Deep Learning

O cenário de dados e IA de 2019

Segundo Matt Turck, em seu artigo original – aqui traduzido, disse que 2019:

Foi outro ano intenso no mundo dos dados, cheio de emoção, mas também de complexidade.

À medida que mais mundo fica on-line, a “informação de dados” de tudo continua a acelerar. Essa mega-tendência continua ganhando força, alimentada pela interseção de avanços separados em infraestrutura, computação em nuvem, inteligência artificial, código aberto e a digitalização geral de nossas economias e vidas.

Alguns anos atrás, a discussão sobre “Big Data” era principalmente técnica, centrada no surgimento de uma nova geração de ferramentas para coletar, processar e analisar grandes quantidades de dados. Muitas dessas tecnologias agora são bem compreendidas e implantadas em escala. Além disso, nos últimos dois anos, em particular, começamos a adicionar camadas de inteligência por meio de ciência de dados, aprendizado de máquina e IA em muitos aplicativos, que agora estão cada vez mais em produção em todos os tipos de produtos de consumo e B2B.

À medida que essas tecnologias continuam melhorando e se expandindo além do grupo inicial de adotantes (FAANG e startups) para a economia e o mundo em geral, a discussão está mudando do puramente técnico para uma conversa necessária sobre o impacto em nossas economias, sociedades e vidas.

Estamos apenas começando a realmente entender a natureza da interrupção à frente . Em um mundo em que a automação orientada a dados se torna a regra (produtos automatizados, carros automatizados, empresas automatizadas), qual é a nova natureza do trabalho? Como lidamos com o impacto social? Como pensamos em privacidade, segurança, liberdade?

Enquanto isso, as tecnologias subjacentes continuam a evoluir em ritmo acelerado, com um ecossistema sempre vibrante de startups, produtos e projetos, anunciando talvez mudanças ainda mais profundas pela frente. Nesse ecossistema, o ano foi caracterizado pelas primeiras entradas de uma consolidação esperada, e talvez pela passagem da guarda de uma época para outra, à medida que as primeiras tecnologias começaram a dar lugar à próxima geração.

Para tentar entender tudo isso, esta é a nossa sexta paisagem e o “estado da união” dos dados e do ecossistema de IA. Para quem estiver interessado em acompanhar a evolução, aqui estão as versões anteriores: 2012 , 2014 , 2016 , 2017 e 2018 .

Continuar lendo O cenário de dados e IA de 2019

Artificial Intelligence Index – Report 2019

O AI Index Report rastreia, coleta, destila e visualiza dados relacionados à inteligência artificial. Sua missão é fornecer dados imparciais e rigorosamente examinados para que formuladores de políticas, pesquisadores, executivos, jornalistas e o público em geral desenvolvam intuições sobre o campo complexo da IA. Expandindo anualmente, o Relatório procura incluir dados sobre o desenvolvimento da IA de comunidades em todo o mundo.

Visualize clicando na imagem abaixo, ou no link.

IAIndex2019

 

120 previsões da IA ​​para 2020

Uma tradução – do Google – do artigo: 120 AI Predictions For 2020 escrito por: Gil Press (todos os direitos reservados ao autor)

Vejam também: 99 (Extra!) AI Predictions For 2020


Gil Press: “Alexa, me diga o que acontecerá em 2020.”

Amazon AI: “Eis o que encontrei na Wikipedia: O Campeonato da Europa de Futebol da UEFA 2020 … [continua a ler na Wikipedia]”

Gil Press: “Alexa, me dê uma previsão para 2020.”

Amazon AI: “O universo não me revelou a resposta.”

Bem, houve uma ligeira melhora em relação às respostas do ano passado , quando a resposta da Alexa à primeira pergunta foi: “Você deseja abrir ‘este dia na história’?”. Quanto ao universo, é um livro aberto para os 120 executivos seniores apresentados aqui, todos envolvidos com a IA, fornecendo previsões para 2020 para uma ampla gama de tópicos: veículos autônomos, deepfakes, pequenos dados, processamento de voz e linguagem natural, inteligência humana e aumentada, tendência e explicabilidade, processamento de borda e IoT e muitas aplicações promissoras de inteligência artificial e tecnologias e ferramentas de aprendizado de máquina.

Continuar lendo 120 previsões da IA ​​para 2020

O que é uma Rede Neural Artificial? (código Python)

Esse artigo esta dividido em duas etapas:

  1. Uma breve descrição sobre Redes Neurais e alguns de seus tipos (Fonte e Direitos);
  2. Detalhando a Rede Neural com Backpropagation com exemplo em Python – com base no artigo em: How to Code a Neural Network with Backpropagation In Python (from scratch) by Jason Brownlee in Code Algorithms From Scratch

Rede Neural Artificial (RNA) pode ser definida como uma estrutura complexa interligada por elementos de processamento simples (neurônios), que possuem a capacidade de realizar operações como cálculos em paralelo, para processamento de dados e representação de conhecimento. Seu primeiro conceito foi introduzido em 1943, mas ganhou popularidade algumas décadas depois com a introdução de algoritmos de treinamento como o backpropagation, que permite a realização de um treinamento posterior para aperfeiçoar os resultados do modelo.

Um Breve Histórico – Um histórico resumido sobre Redes Neurais Artificiais deve começar por três das mais importantes publicações iniciais, desenvolvidas por: McCulloch e Pitts (1943), Hebb (1949), e Rosemblatt (1958). Estas publicações introduziram o primeiro modelo de redes neurais simulando “máquinas”, o modelo básico de rede de auto-organização, e o modelo Perceptron de aprendizado supervisionado, respectivamente.

Alguns históricos sobre a área costumam “pular” os anos 60 e 70 e apontar um reinicio da área com a publicação dos trabalhos de Hopfield (1982) relatando a utilização de redes simétricas para otimização e de Rumelhart, Hinton e Williams que introduziram o poderoso método Backpropagation.

Entretanto, para se ter um histórico completo, devem ser citados alguns pesquisadores que realizaram, nos anos 60 e 70, importantes trabalhos sobre modelos de redes neurais em visão, memória, controle e auto-organização como: Amari, Anderson, Cooper, Cowan, Fukushima, Grossberg, Kohonen, von der Malsburg, Werbos e Widrow.

Fonte

Mais informações históricas…

Continuar lendo O que é uma Rede Neural Artificial? (código Python)

Luppar News-Rec (Recomendador Inteligente de Notícias)

O Luppar News-Rec (Versão 1) é fruto da minha dissertação de Mestrado,  mais detalhes sobre – visualize aqui! É um Sistema Recomendador de Notícias (SRN) composto por algoritmos clássicos de classificação que trabalham em conjunto com representações de documentos para solucionar o problema de classificação de notícias de forma a trazer os documentos(notícias) que atendam a necessidade do usuário. A metodologia que segue esse trabalho divide os esforços da implementação do SRN em três etapas: Subsistema de Captura, Pré-Processamento e Armazenamento, Subsistema de Classificação de Notícias e Subsistema de Aquisição de Perfil de Assinantes e Distribuição.

Recursos do Luppar News-Rec

News Recommender System using Word Embeddings for study and research.

Disponível em: http://luppar.com/recommender

Coleções de documentos

  • Z5News (Coleção em Inglês com 5 tópicos)
    • sportsNews, politicsNews, technologyNews, PersonalFinance e brazil-news
  • Z5NewsBrasil (Coleção em Portugues com 5 tópicos)
    • esporteNews, politicaNews, tecnologiaNews, financaPessoal e educacaonews
  • Z12News (Coleção em Inglês com 12 tópicos)
    • sportsnews, politicsNews, technologyNews, PersonalFinance, brazil-news, aerospace-defense, autos, commoditiesNews, fundsNews, foreignexchangeNews, healthnews e environmentnews

Continuar lendo Luppar News-Rec (Recomendador Inteligente de Notícias)

Avançando o processamento de linguagem natural (NLP) para domínios corporativos

Por Salim Roukos, IBM Fellow (todos os direitos reservados ao autor – matéria (EN))

Segundo Salim Roukos, encontrar informações no vasto acervo de documentos e bases de conhecimento de uma empresa para responder às perguntas dos usuários nunca é tão fácil quanto deveria ser. As respostas podem muito bem existir, mas geralmente permanecem fora de alcance por vários motivos.

Para iniciantes, ao contrário da Web, onde as informações são conectadas através de um rico conjunto de links e geralmente são capturadas de forma redundante em várias formas (facilitando a localização), o conteúdo corporativo geralmente é armazenado em silos com muito menos repetição das informações principais. Além disso, os usuários que pesquisam conteúdo corporativo geralmente fazem perguntas complexas e esperam respostas mais detalhadas do que receberiam de um mecanismo de pesquisa na Web. Isso pode incluir perguntas sobre suporte ao produto, faturas, o regulamento mais recente aplicável a contratos com clientes, as implicações de eventos descobertos em sites de notícias e assim por diante. Por fim, as empresas costumam relutar em confiar na IA da ‘caixa preta’ que não pode explicar suas recomendações e pode exigir técnicas explicáveis ​​aos tomadores de decisão ou usuários finais.

O processamento de linguagem natural (do inglês: Natural Language ProcessingNLP) é uma grande promessa para ajudar a encontrar informações tão profundas no conteúdo da empresa, permitindo que os usuários expressem mais livremente suas necessidades de informações e fornecendo respostas precisas para perguntas cada vez mais complexas. No entanto, os sistemas empresariais de NLP são frequentemente desafiados por vários fatores, que incluem compreender silos heterogêneos de informações, lidar com dados incompletos, treinar modelos precisos a partir de pequenas quantidades de dados e navegar em um ambiente em mudança no qual novos conteúdos, produtos, termos e outras informações são continuamente adicionadas.

Continuar lendo Avançando o processamento de linguagem natural (NLP) para domínios corporativos

Materiais sobre Inteligência Artificial, Machine Learning, Statistics e etc…

Abaixo uma coleção de links de materiais de diversos assuntos relacionados a Inteligência Artificial, Machine Learning, Statistics, Processamento de Linguagem Natural e etc…

Dicas diversas

Manipulando Strings com Python
https://www.linkedin.com/pulse/manipulando-strings-com-python-fernanda-santos

140 Machine Learning Formulas
https://www.datasciencecentral.com/profiles/blogs/140-machine-learning-formulas

40 Techniques Used by Data Scientists
https://www.datasciencecentral.com/profiles/blogs/40-techniques-used-by-data-scientists

Continuar lendo Materiais sobre Inteligência Artificial, Machine Learning, Statistics e etc…

Rotulando com o Active Learning

A verdade feia por trás de todos esses dados

Estamos na era dos dados. Nos últimos anos, muitas empresas já começaram a coletar grandes quantidades de dados sobre seus negócios. Por outro lado, muitas empresas estão apenas começando. Se você trabalha em uma dessas empresas, pode estar se perguntando o que pode ser feito com todos esses dados.

Que tal usar os dados para treinar um algoritmo de aprendizado de máquina supervisionado (ML – Machine Learning)? O algoritmo ML poderia executar a mesma tarefa de classificação que um ser humano faria, muito mais rápido! Poderia reduzir custos e ineficiências. Pode funcionar com os dados combinados, como imagens, documentos de texto e apenas números simples. Poderia fazer todas essas coisas e até obter essa vantagem sobre a concorrência.

No entanto, antes que você possa treinar qualquer modelo supervisionado decente, você precisa de dados básicos da verdade. Geralmente, os modelos supervisionados de ML são treinados em registros de dados antigos que já estão rotulados de alguma forma. Os modelos treinados são aplicados para executar previsões de rótulos em novos dados. E esta é a verdade feia: antes de prosseguir com qualquer treinamento de modelo, qualquer definição de problema de classificação ou qualquer entusiasmo adicional na coleta de dados, você precisa de um conjunto suficientemente grande de registros de dados rotulados corretamente para descrever seu problema. E a rotulagem de dados – especialmente em uma quantidade suficientemente grande – é … cara.

Continuar lendo Rotulando com o Active Learning

O que há de novo no Hype Cycle da Gartner para IA, 2019

Gartner-Hype-Cycle-For-Artificial-Intelligence-2019

  • Entre 2018 e 2019, as organizações que implantaram inteligência artificial (IA) aumentaram de 4% para 14%, de acordo com a pesquisa CIO Agenda 2019 da Gartner.
  • A IA de conversação permanece no topo das agendas corporativas estimuladas pelo sucesso mundial do Amazon Alexa, Google Assistant e outros.
  • As empresas estão progredindo com a IA à medida que ela cresce mais e também cometem mais erros que contribuem para sua curva de aprendizado acelerada.

Continuar lendo O que há de novo no Hype Cycle da Gartner para IA, 2019

Sistemas de recomendação na prática

Empresas como Amazon, Netflix, Linkedin e Pandora aproveitam os sistemas de recomendação para ajudar os usuários a descobrir itens novos e relevantes (produtos, vídeos, trabalhos, músicas), criando uma experiência agradável para o usuário enquanto impulsiona a receita incremental.

Nesse artigo do Houtao Deng é fornecido uma visão prática dos sistemas de recomendação. Primeiro, três sistemas principais são revisados: filtragem baseada em conteúdo, colaborativa e híbrida, seguida de discussões sobre inicialização a frio, escalabilidade, interpretabilidade e exploração / exploração.

Recomendação baseada em conteúdo

Na Pandora, uma equipe de músicos rotulou cada música com mais de 400 atributos. Então, quando um usuário seleciona uma estação de música, as músicas que correspondem aos atributos da estação serão adicionadas à lista de reprodução (Projeto Genoma da Música | Pandora, Howe | Pandora).

Esta é uma recomendação baseada em conteúdo. Usuários ou itens têm perfis que descrevem suas características e o sistema recomendaria um item a um usuário se os dois perfis corresponderem. A caixa de moda do Stitch Fix é outro exemplo de recomendação baseada em conteúdo. Os atributos de um usuário são coletados (altura, peso, etc.) e os produtos de moda correspondentes são colocados em uma caixa entregue ao usuário (Stitch Fix | 2013).

Continuar lendo Sistemas de recomendação na prática