Arquivo da categoria: Recuperação da Informação

Previsão de popularidade de notícias em blogs

Ensinando Máquinas

Autores: Jônathan Elias Sousa da Costa e Renan Basílio

1: Introdução

O tema abordado neste trabalho é a popularidade de uma notícia publicada online, medida em quantidade de vezes que a mesma foi compartilhada por seus leitores. Para este propósito, foi utilizado como referência o dataset Online News Popularity[3], dataset este constituído por artigos publicados pelo site de notícias Mashable[4] durante o período de 2013 a 2015.

Note que como o dataset se refere a apenas um site, este tenderá a produzir resultados válidos apenas ao mesmo, potencialmente não sendo aplicável a outros sites de notícias que não compartilhem os mesmos nichos de usuários com o site em questão. Ainda assim é nossa opinião que os resultados produzidos pela análise deste tenham utilidade, ainda que exclusiva ao site que o produziu.

Este trabalho foi realizado para a disciplina COC361 – Inteligência Computacional, ministrada pelo professor Alexandre Evsukoff…

Ver o post original 5.938 mais palavras

Detecção de Mal de Parkinson através de Gravações de Voz

Ensinando Máquinas

Introdução

Este relatório aborda problema, desenvolvimento e resultados de análise e modelagem de um conjunto de dados (dataset), como parte das avaliações da disciplina de Inteligência Computacional da Universidade Federal do Rio de Janeiro (UFRJ). Os autores, Lucas Barcellos Oliveira e Pedro Wagner, ambos alunos do curso de Engenharia de Computação e Informação, foram orientados pelo Prof. Alexandre Evsukoff.

O Mal de Parkinson é uma condição que afeta mais de 200 mil brasileiros e apresenta tendência de crescimento no número de diagnósticos, de acordo com a OMS. A doença que afeta, na maioria dos casos, idosos provoca tremores e perda de firmeza nos braços, pernas e cordas vocais, prejudicando a mobilidade e independência dos pacientes.

No entanto, um diagnóstico nos primeiros estágios do desenvolvimento permite uma melhor preparação, através de medicamentos e atividades de fisioterapia, para os estágios posteriores, mitigando ou, no mínimo, postergando as complicações causadas…

Ver o post original 4.000 mais palavras

Modelos Preditivos de Notas de Redação do ENEM 2015

Ensinando Máquinas

Alunos: Carlos Eduardo Marciano e João Victor Davim

Universidade Federal do Rio de Janeiro – 2017.2

“Science is what we understand well enough to explain to a computer. Art is everything else we do.” –Donald Knuth

Introdução

       Muito se questiona acerca das notas da redação do Exame Nacional do Ensino Médio, principal meio de acesso às universidades do Brasil. Movidos por esta curiosidade, e por acreditar que nosso trabalho possa ter um impacto positivo na discussão do modelo ideal de acesso ao ensino superior brasileiro, escolhemos criar modelos preditivos que, baseados em diversos fatores acerca de um candidato, faça uma previsão acerca de sua nota de redação.

A fim de explorarmos diversas possibilidades, propomos alguns diferentes métodos conhecidos da literatura e avaliamos seus desempenhos. De fato, estamos interessados em buscar modelos consistentes, que nos permitam observar as predições e tirar conclusões acerca de sua performance. Com isso, esperamos que…

Ver o post original 3.179 mais palavras

Text Analytics com R, exemplo prático: analisando dados de futebol do Twitter

Blog Dataficação

Durante o programa Bate Bola, da ESPN, do dia 12/12/2016, foi solicitado aos telespectadores que enviassem suas seleções ideais dos melhores jogadores do Campeonato Brasileiro 2016 utilizando a hashtag #bateboladebate. A ideia deste post é mostrar como obter dados dos tweets enviados no programa neste dia e realizar a contagem dos nomes dos jogadores que foram mais citados. Assim, conseguiremos demonstrar uma aplicação real da utilização de Text Mining, extraindo dados do Twitter e montando uma seleção com os jogadores mais mencionados pelos torcedores. Vamos utilizar a ferramenta R, que permite trabalharmos com dados de redes sociais e realizarmos a limpeza dos dados. Pra quem não conhece, o R é uma ferramenta de análise de dados e que possui uma linguagem própria para manipulação dos dados.

Extraindo os tweets

Para realizar a captura dos dados do Twitter, são necessárias 3 etapas:

1- Criar uma aplicação do Twitter utilizando o

Ver o post original 779 mais palavras