Arquivo da tag: Word2Vec

TOP 10 Posts +1 sobre NLP de 2019…

Tempo de Leitura: 5 minutos

Natural-Language-Processing-03-1

Compartilhando com vocês os “TOP 10 artigos sobre NLP (Natural Language Processing) de 2019, isto é, os Posts que publiquei em 2019 e que teve maiores audiências. Espero que gostem dessa relação e que alguns destes possam ser úteis no seu dia a dia, caso ainda não tenha visto. Vamos lá…

#10 – LUPPAR NEWS-REC (RECOMENDADOR INTELIGENTE DE NOTÍCIAS)

Luppar News-Rec (Versão 1) é fruto da minha dissertação de Mestrado! É um Sistema Recomendador de Notícias (SRN) composto por algoritmos clássicos de classificação que trabalham em conjunto com representações de documentos para solucionar o problema de classificação de notícias de forma a trazer os documentos(notícias) que atendam a necessidade do usuário.

#9 – AVANÇANDO O PROCESSAMENTO DE LINGUAGEM NATURAL (NLP) PARA DOMÍNIOS CORPORATIVOS

O processamento de linguagem natural (do inglêsNatural Language Processing – NLP) é uma grande promessa para ajudar a encontrar informações tão profundas no conteúdo da empresa, permitindo que os usuários expressem mais livremente suas necessidades de informações e fornecendo respostas precisas para perguntas cada vez mais complexas. No entanto, os sistemas empresariais de NLP são frequentemente desafiados por vários fatores, que incluem compreender silos heterogêneos de informações, lidar com dados incompletos, treinar modelos precisos a partir de pequenas quantidades de dados e navegar em um ambiente em mudança no qual novos conteúdos, produtos, termos e outras informações são continuamente adicionadas.

Continuar lendo TOP 10 Posts +1 sobre NLP de 2019…

Luppar News-Rec (Recomendador Inteligente de Notícias)

O Luppar News-Rec (Versão 1) é fruto da minha dissertação de Mestrado,  mais detalhes sobre – visualize aqui! É um Sistema Recomendador de Notícias (SRN) composto por algoritmos clássicos de classificação que trabalham em conjunto com representações de documentos para solucionar o problema de classificação de notícias de forma a trazer os documentos(notícias) que atendam a necessidade do usuário. A metodologia que segue esse trabalho divide os esforços da implementação do SRN em três etapas: Subsistema de Captura, Pré-Processamento e Armazenamento, Subsistema de Classificação de Notícias e Subsistema de Aquisição de Perfil de Assinantes e Distribuição.

Recursos do Luppar News-Rec

News Recommender System using Word Embeddings for study and research.

Disponível em: http://luppar.com/recommender

Coleções de documentos

  • Z5News (Coleção em Inglês com 5 tópicos)
    • sportsNews, politicsNews, technologyNews, PersonalFinance e brazil-news
  • Z5NewsBrasil (Coleção em Portugues com 5 tópicos)
    • esporteNews, politicaNews, tecnologiaNews, financaPessoal e educacaonews
  • Z12News (Coleção em Inglês com 12 tópicos)
    • sportsnews, politicsNews, technologyNews, PersonalFinance, brazil-news, aerospace-defense, autos, commoditiesNews, fundsNews, foreignexchangeNews, healthnews e environmentnews

Continuar lendo Luppar News-Rec (Recomendador Inteligente de Notícias)

Materiais sobre Inteligência Artificial, Machine Learning, Statistics e etc…

Abaixo uma coleção de links de materiais de diversos assuntos relacionados a Inteligência Artificial, Machine Learning, Statistics, Processamento de Linguagem Natural e etc…

Dicas diversas

Manipulando Strings com Python
https://www.linkedin.com/pulse/manipulando-strings-com-python-fernanda-santos

140 Machine Learning Formulas
https://www.datasciencecentral.com/profiles/blogs/140-machine-learning-formulas

40 Techniques Used by Data Scientists
https://www.datasciencecentral.com/profiles/blogs/40-techniques-used-by-data-scientists

Continuar lendo Materiais sobre Inteligência Artificial, Machine Learning, Statistics e etc…

O Word2Vec Ilustrado

O conceito de embeddings é uma das idéias mais fascinantes no aprendizado de máquina. Se você já usou o Siri, o Google Assistente, o Alexa, o Google Tradutor ou até mesmo o teclado do smartphone com a previsão da próxima palavra, então provavelmente você se beneficiou dessa ideia que se tornou central nos modelos de processamento de linguagem natural. Houve um grande desenvolvimento nas últimas duas décadas no uso de embeddings para modelos neurais (desenvolvimentos recentes incluem incorporação de palavras contextualizadas que levam a modelos de ponta como o BERT e o GPT2).

O Word2vec é um método para criar de maneira eficiente a incorporação de palavras e existe desde 2013. Mas, além de sua utilidade como método de incorporação de palavras, alguns de seus conceitos demonstraram ser eficazes na criação de mecanismos de recomendação e no sentido de dados sequenciais em tarefas comerciais, não linguísticas. Empresas como a Airbnb , a Alibaba , a Spotify e a Anghami se beneficiaram ao esculpir essa peça brilhante de maquinário do mundo da NLP e usá-la na produção para capacitar uma nova geração de mecanismos de recomendação.

Neste post, falaremos sobre o conceito de incorporação e a mecânica de geração de integrações com o word2vec. Mas vamos começar com um exemplo para nos familiarizarmos com o uso de vetores para representar as coisas. Você sabia que uma lista de cinco números (um vetor) pode representar muito sobre sua personalidade?

Continuar lendo O Word2Vec Ilustrado

The amazing power of word vectors

the morning paper

For today’s post, I’ve drawn material not just from one paper, but from five! The subject matter is ‘word2vec’ – the work of Mikolov et al. at Google on efficient vector representations of words (and what you can do with them). The papers are:

From the first of these papers (‘Efficient estimation…’) we get a description of the Continuous Bag-of-Words and Continuous Skip-gram models for learning word vectors (we’ll talk about what a word vector is in a moment…). From the second paper we get more illustrations of the…

Ver o post original 1.685 mais palavras

Word Embedding – visual inspector

Ferramenta visual para ver o funcionamento do Word2Vec, elaborada por Xin Rong.

w2v_simula

Veja também: 

Recuperação da Informação

Explore word analogies (word2viz)

 

{Alex Souza}

Introdução aos Word Embeddings

Muito bom e explicativo esse vídeo do Christian S. Perone, confiram abaixo!

 

All the Backpropagation derivatives