Mineração de texto: buscando o que é mais precioso em um mundo de informação

Sobre a Vale

23/01/2019

Mineração de texto: buscando o que é mais precioso em um mundo de informação

Mineração: ação ou efeito de minerar; depuração do minério extraído das minas. Certo? Certo. E disso entendemos bem, afinal, apenas no terceiro trimestre do ano passado produzimos 100 milhões de toneladas de minério de ferro, um recorde para o período. Mas é preciso admitir que, já há um bom tempo, mineração não se resume a isso. Nessa matéria, publicada em 2018, mostramos que o termo “mineração” está sendo muito usado também para tratar de processos que só acontecem no mundo digital, como a mineração de dados e a mineração de bitcoins.

Outro uso relativamente novo do termo é na expressão mineração de texto. Isso mesmo: o volume de conteúdo publicado na internet diariamente é tão gigantesco, que analistas estão usando a mineração de texto para extrair informações importantes e que podem gerar insights e respostas para questões de pesquisa.


Essa nuvem de palavras foi extraída do conteúdo dessa matéria. No centro, as que aparecem com maior frequência

Tecnologia a favor da mineração

Também conhecida como “mineração de dados textuais” ou “descoberta de conhecimentos em textos”, a técnica serve para filtrar grandes quantidades de conteúdo e extrair a informação que você precisa. Ela é realizada por meio de softwares bem inteligentes, que não são apenas ferramentas de busca em bancos de dados. Alguns softwares, como mostra esse vídeo da Eselvier - uma das mais importantes editoras de literatura científica do mundo -, entendem cada termo da questão inicial que o pesquisador (ou simplesmente curioso) tem sobre o tema. A partir da pergunta de pesquisa, esses programinhas identificam os padrões, ligações e tendências com base nos textos que foram minerados. Eles verificam a frequência do uso de certas palavras, categorizam o conteúdo, enfim, transformam quantidades enormes de textos em dados organizados que podem ser analisados.

Na Vale a tecnologia também está transformando a forma de fazer mineração. Inteligência artificial e análise computacional estão cada vez mais presentes em nossos processos de trabalho. A diferença, claro, é nosso produto final: minério de ferro, pelotas, níquel, cobre... Na nossa empresa já começa a ser realidade, em Minas Gerais, o uso de caminhões fora de estrada que circulam sem um operador na cabine. Os veículos, com capacidade para 240 toneladas, são controlados apenas por sistemas de computador, GPS, radares e inteligência artificial. A utilização de drones e da análise avançada de dados também estão em nossa rotina, trazendo mais eficiência em muitas iniciativas. Fundamos até mesmo o Digital Lab, ambiente voltado para experimentar e pesquisar novas tecnologias que possam potencializar os resultados da nossa empresa e disseminar a cultura da inovação.

Já a mineração de texto tem sido bastante utilizada, por exemplo, para realizar pesquisas a partir do conteúdo publicado em redes sociais ou nos comentários feitos por consumidores em sites de compra. As postagens e comentários, quando analisadas por técnicas de mineração de texto, são uma fonte valiosa de informação para empresas, que podem usar a opinião ou sentimento das pessoas com relação a produtos e marcas para gerar novas campanhas publicitárias. Outra utilização frequente é na área biomédica, que produz uma enormidade de artigos e pesquisas que pode ser melhor utilizada com o auxílio da mineração de texto, machine learning e algoritmos. Estudos genéticos e sobre estruturas de proteínas são beneficiados pela técnica.

Quer saber mais sobre mineração de texto?

Veja algumas fontes de que usamos para fazer essa matéria e descubra mais sobre mineração de texto.


​​
​​

Mineração de texto: buscando o que é mais precioso em um mundo de informação