Os algoritmos de text mining desempenham hoje para a humanidade um papel semelhante ao dos microscópios no momento de sua invenção. Isso porque a mineração permite enxergar no texto características, padrões e tendências que são invisíveis a olho nu.
O text mining não é importante apenas porque nos permite compreender big data, uma massa de texto que nenhum humano seria capaz de ler integralmente, mas também porque nos permite enxergar nessa massa de texto várias informações que não conseguiríamos obter mesmo que lêssemos todo o enorme texto. A mineração não muda apenas a quantidade de texto que conseguimos ler, mas também a qualidade dessa leitura.
O que é Text Mining?
O text mining já é muito usado por cientistas, dentro de um campo de pesquisa chamado metaciência, que analisa grandes quantidades de relatórios e artigos científicos para aprimorar os métodos de pesquisa e tornar a ciência mais eficiente. A mineração de texto também é utilizada numa área chamada humanidades digitais, que viabiliza pesquisas mais eficientes em linguística, economia, sociologia e outras áreas.
A mineração de texto se utiliza normalmente de uma teoria chamada redes semânticas, que permite organizar o texto de forma a ser processado mais rapidamente pelos computadores. As redes semânticas geram gráficos semelhantes às nuvens de palavras, que além de destacar as palavras mais usadas no texto, também destacam as conexões entre elas.
Nuvem de palavras e Rede semântica
O text mining é chamado de text analytics quando seu uso envolve não apenas descobrir informações importantes na massa de texto, mas também tomar decisões estratégicas com base nessas informações. Para a realização de text analytics, que muito interessa aos negócios, somente redes semânticas são em geral insuficientes, sendo necessário utilizar redes semântico-temporais. Elas são várias redes semânticas organizadas em sequência, da mais antiga para a mais atual.
Rede semântico-temporal
Como utilizar o Text Mining no Marketing?
Branding
Podemos gerar várias aplicações e benefícios para o marketing e para os negócios usando redes semântico-temporais na mineração de texto. A primeira aplicação é relativa ao branding, pois a mineração de texto permite associar qualquer marca às palavras mais conectadas a ela numa massa de texto de um jornal de grande circulação ou de redes sociais. Podemos observar na planilha a seguir um exemplo de utilização de redes semântico-temporais para analisar as palavras mais associadas à marca “Ford” no texto completo do jornal The New York Times ao longo de 20 anos.
18 palavras mais associadas à marca Ford no jornal The New York Times de 2000 a 2019
A planilha anterior nos apresenta várias informações úteis sobre a marca “Ford”. Podemos observar a alteração da importância da palavra “recall”, que é muito associada a essa marca de 2011 a 2015, sendo a sétima palavra mais associada a essa marca em 2014. Entender isso pode ajudar a equipe de marketing dessa empresa a trabalhar para afastar essa palavra negativa de sua marca.
A mesma planilha nos permite identificar quais concorrentes são mais associados à marca “Ford”. Saber que a marca “Chrysler” é muito associada à “Ford” desde os primeiros anos analisados e que as marcas “Volkswagen” e “Fiat” passam a ser associadas a ela somente nos últimos anos apresenta uma tendência temporal que pode ser útil não só ao marketing mas a todo o planejamento estratégico da empresa.
Palavras relacionadas a marca
Uma segunda aplicação das redes semântico-temporais na mineração de texto para marketing e negócios pode ser observada na planilha a seguir, que mostra as palavras mais associadas a “car” no texto completo do jornal The New York Times ao longo de 20 anos.
18 palavras mais associadas a “car” no jornal The New York Times de 2000 a 2019
A planilha anterior também pode ser útil à equipe de marketing da marca “Ford”, já que demonstra as palavras mais associadas ao mercado de carros. Podemos observar nesta planilha a variação de importância das palavras “accident” e “crash”, que pode impactar na decisão do consumidor sobre comprar ou não um carro. Conhecer esta informação, invisível para quem lê o mesmo jornal a olho nu, pode permitir à equipe de marketing planejar uma campanha que enfatiza os itens de segurança dos carros de sua marca para atingir os consumidores preocupados com isso. A informação sobre a importância das palavras “accident” e “crash”, mais difícil de visualizar na planilha acima, pode ser facilmente observada em outro tipo de plotagem dos mesmos dados nos gráficos a seguir.
Variação da associação das palavras “accident” e “crash” à palavra “car” no jornal The New York Times de 2000 a 2019
Palavras-chave em Campanhas
Uma terceira aplicação da mineração de texto aos negócios implica fundir as duas aplicações anteriores para definir as palavras-chave a utilizar numa campanha de marketing digital. A equipe de marketing pode escolher as palavras-chave a utilizar em sua campanha com base nas palavras mais associadas à marca e ao seu mercado.
Análise de sentimentos
Uma quarta aplicação da mineração de texto ao marketing demanda retomar a primeira aplicação, filtrar apenas os adjetivos que se conectam à marca e definir quais deles são positivos, negativos ou neutros. Essa classificação dos adjetivos permite gerar um índice numérico de positividade ou negatividade da marca, chamado Net Image Score. A variação desse índice ao longo dos anos pode ser utilizado pela equipe de marketing como uma medida da efetividade de suas campanhas.
Insights e tendências
Uma quinta aplicação da mineração de texto aos negócios está relacionada à possibilidade de utilizar os dados de conexão de palavras existentes para predizer as tendências dos anos futuros. Ao ser alimentada com planilhas de centenas de milhares de linhas de conexão entre palavras, uma inteligência artificial pode facilmente projetar quais serão as palavras mais conectadas a uma marca ou mercado nos anos seguintes.
Essas cinco aplicações da mineração de texto ao marketing e aos negócios são apenas o começo, muitas outras já existem ou surgirão em breve. Se você ainda não utiliza text mining em seu negócio, provavelmente obterá melhores resultados ao utilizá-la. Ela pode ser a chave para tomar decisões estratégicas orientadas por dados e, por isso, mais seguras.
Oldimar Cardoso é sócio-fundador da sWords, empresa especializada em text mining e parceiro da BPool.
Oldimar Cardoso
Sócio-fundador da sWords