Big Data, Business Intelligence (BI), Data Science, Machine Learning

Definindo a ciência de dados: o quê, onde e como a ciência de dados

Ciência de dados – um termo universalmente reconhecível que precisa desesperadamente de divulgação.

Ciência de dados é um termo que foge a qualquer definição completa única, o que dificulta o uso, principalmente se o objetivo é usá-lo corretamente. A maioria dos artigos e publicações usa o termo livremente, com a suposição de que ele é universalmente entendido. No entanto, a ciência de dados – seus métodos, objetivos e aplicativos – evolui com o tempo e a tecnologia. A ciência de dados há 25 anos se referia à coleta e limpeza de conjuntos de dados e à aplicação de métodos estatísticos a esses dados. Em 2018, a ciência de dados cresceu para um campo que abrange análise de dados, análise preditiva, mineração de dados, inteligência de negócios, aprendizado de máquina e muito mais.

Continuar lendo

Banco de Dados, Big Data, NoSQL

MySQL JSON Document Store

O MySQL é o banco de dados Open Source mais popular! Um banco de dados relacional compatível com ACID (sigla para Atomicity, Consistency, Isolation e Durability) que permite, entre outros, gerenciar seus dados com o SQL poderoso e comprovado, cuidar da integridade dos dados com transações, chaves estrangeiras… Mas você já sabe disso!

A Notação de Objeto JavaScript, mais conhecida como JSON, é um formato de troca de dados leve e muito popular. Use para armazenar e trocar dados.
Um documento JSON é um objeto padronizado que pode representar dados estruturados. E a estrutura está implícita no documento. Enfim, aposto que você também sabe disso!

Iniciado no MySQL 5.7.8, você pode manipular documentos JSON de forma “relacional”, usando consultas SQL e também armazenando-os usando o tipo de dados JSON nativo do MySQL. Também fornecemos um grande conjunto de funções JSON. Espero que você esteja ciente disso!

Conheça mais sobre – clicando nesse link! Exemplos e etc!

Documentação

Download do MySQL

MySQL_8.0_Document_Store_Architecture

Big Data, Dados

O que se faz em 1 minuto na Internet?

Big Data, Dados, Segurança da Informação

Lei Geral de Proteção de Dados (LGPD)

Projeto de Lei: 5762 – 2019 (Ementa – Altera a Lei nº 13.709, de 2018, prorrogando a data da entrada em vigor de dispositivos da Lei Geral de Proteção de Dados Pessoais – LGPD – para 15 de agosto de 2022.)

LEI Nº 13.709, DE 14 DE AGOSTO DE 2018
Dispõe sobre a proteção de dados pessoais e altera a Lei nº 12.965, de 23 de abril de 2014 (Marco Civil da Internet).

No dia 14/08/2018 foi sancionada a Lei de Proteção de Dados, selecionei duas matérias que julgo importante e nos dá uma base de como funcionará essa lei, que entra em vigor em 18 meses.

Vejam as matérias abaixo:

Fonte e direitos: Tecnoblog

O presidente Michel Temer sancionou nesta terça-feira (14) o projeto de lei da Câmara 53/2018, que estabelece regras para a coleta e o tratamento de dados pessoais no Brasil. A lei, que entra em vigor daqui a 18 meses, é inspirada no Regulamento Geral sobre a Proteção de Dados (GDPR), que passou a valer na União Europeia em maio com o objetivo de assegurar a privacidade dos cidadãos.

A autoridade que seria criada para garantir a aplicação da lei, batizada de Agência Nacional de Proteção de Dados (ANPD), foi vetada por ser inconstitucional. Temer diz que houve “vício de iniciativa”, ou seja, a proposta não partiu do órgão competente. O presidente afirma, no entanto, que vai enviar ao Congresso um projeto sobre o mesmo tema, proposto pelo Executivo.

O que muda com a lei de proteção de dados pessoais

Continuar lendo

Banco de Dados, Big Data, Importantes, Projeto

GDPR: a nova lei cibernética que pode afetar todo o mundo

A GDPR é uma nova lei europeia que entrará em vigor nos próximos dias. Ao reforçar as proteções de dados dos cidadãos da Europa, todas as empresas de pequeno, médio e grande porte terão que investir em cibersegurança. E não são apenas empresas locais: companhias de todo o mundo que têm negócios com a Europa precisarão se adequar. Ou seja, a mudança é global.

*** Entrará em vigor no dia 25 de Maio de 2018 ***

“A lei é clara: vazamentos de dados devem ser informados à DPA (comissão de proteção de dados) em até 72 horas e aos clientes afetados ‘sem demora injustificada'”

“Basicamente, as companhias terão que correr para aprender a proteger de maneira correta os dados de clientes”

Os 3 Pilares:
1. Governança de dados
2. Gestão de dados, que diz respeito à forma como tratar das atividades de processamento
3. Transparência de dados

E no Brasil?

Vejam a matéria completa clicando na imagem abaixo, ou no seguinte link.

gdpr

Big Data, Data Science, Importantes, Software Livre

7 ferramentas gratuitas de análise de dados que você deve conhecer

O software de análise de dados não precisa custar muito para ser eficaz. Essas ferramentas gratuitas podem ajudar as empresas a descobrir novos insights e obter previsões valiosas a partir de várias fontes de dados.

São eles (em ordem alfabética)
1 -DataMelt
2 – KNIME Analytics Platform
3 – OpenRefine
4 – Orange
5 – R
6 – Tableau Public
7 – Trifacta Wrangler

Maiores detalhes clicando na matéria completa (imagem abaixo ou no neste link)

Big Data, Data Science, IA (Inteligência Artificial), NoSQL

Por que as iniciativas de análise de dados ainda falham?

Talvez o problema esteja nas práticas de governança de dados. É preciso dar mais ênfase na qualidade e no contexto dos dados

Na matéria é listado 7 práticas problemáticas de uso de dados, são elas:
1 – Reunir dados, mas não integrá-los realmente
2 – Não perceber que as unidades de negócios têm necessidades exclusivas
3 – Recrutar apenas cientistas de dados
4 – Deixar de gerenciar o ciclo de vida dos dados
5 – Concentrar-se no volume, em vez de segmentar a relevância
6 – Fornecer dados, mas ignorar sua origem
7 – Fornecer dados, mas não ajudar os usuários a entender o contexto

Clique aqui para ver a matéria completa!

 

Big Data, Business Intelligence (BI), Dados, Data Science

McKinsey: Competindo em um Mundo Guiado por Dados

Fonte: O futuro das coisas

Conforme O futuro das coisas, o novo report da McKinsey Global Institute explora a fundo como a tecnologia digital está impactando a produtividade, o crescimento e a competitividade no nosso mundo. Também mostra quais as oportunidades que estão em jogo para as empresas.

The Age of Analytics: Competing In A Data-Driven World é um report (136 páginas PDF) baseado em mais de cinco anos de pesquisa em dados e analytics.

Nestes 5 anos, eles observaram como a adoção da ciência de dados acelerou especificamente as áreas de aprendizagem de máquina (machine learning) e de aprendizagem profunda (deep learning).

Dentre as análises, a McKinsey identificou 120 usos potenciais do aprendizado de máquina em 12 indústrias, além de ter realizado uma pesquisa com mais de 600 especialistas dessas indústrias para entender o que acham sobre o potencial impacto dessa tecnologia.

A descoberta mais surpreendente foi a extraordinária amplitude das potenciais aplicações da aprendizagem de máquina; Cada uma dessas aplicações foi identificada como sendo uma das três primeiras em uma determinada indústria por pelo menos um especialista dessa indústria.

Os pesquisadores da McKinsey então plotaram as 120 aplicações mais importantes no mapa abaixo. O eixo Y mostra o volume de dados disponíveis (abrangendo amplitude e freqüência), enquanto o eixo X mostra o potencial impacto dessa tecnologia, com base nas pesquisas feitas com os mais de 600 especialistas dessas indústrias.

Os usos específicos que combinam riqueza de dados com maiores oportunidades são as bolhas maiores no quadrante superior direito do gráfico. Estas representam áreas onde as empresas deveriam priorizar o uso da aprendizagem de máquina e se preparar para uma transformação que começa a acontecer.

Alguns dos usos de maior oportunidade são: publicidade personalizada; veículos autônomos; otimização de preços, rotas e programação com base em dados em tempo real em viagens e logística; previsão de resultados de saúde personalizada; e otimização de estratégias de merchandising no varejo.

Continuar lendo