Criado: 30/07/2021

Atualizado: 24/01/2022

Status: 🌱


Acabamos adotando o Google Colab como ferramenta oficial para os experimentos do projeto de pesquisa intitulado “O Ensino Remoto no IFPB-CZ: perspectivas estudantis através da análise de sentimentos” meio que por conta da conveniência, mas, depois que eu testei rapidamente outras duas opções (Kaggle e Cocalc), percebi que foi uma decisão acertada. Eu queria ter tirado algumas capturas de tela para ilustrar esta postagem, mas não tirei, então fiquemos somente com as minhas impressões mesmo.

Comecei testando o Kaggle com esperança de mudar de fato para ele, já que é "a" ferramenta utilizada pela comunidade de ciência de dados. Implementei a primeira linha necessária para baixar a Wordnet pelo NTLK:

nltk.download('wordnet')

E... Simplesmente o Kaggle não faz downloads de recursos externos. Sem o corpus da Wordnet não há tokenização. Sem tokens não podemos retirar os lemas. Sem lematização não tem análise e por aí vai.

Pulei para o Cocalc, que enche os olhos por utilizar padrões abertos, oferecer uma versão gratuita e ter um foco interessante em projetos educacionais. Coloquei pra rodar a instrução acima e aguardei o download. Depois de dez minutos sem qualquer atualização desisti.

É provável que o Kaggle só precisava ser configurado corretamente ou que o Cocalc no plano gratuito fosse realmente muito lento e que seria necessário um plano pago, mas não tive muito paciência tempo para pesquisar sobre como solucionar esses problemas. Só me restava a última alternativa da lista, o Google Colab.

Me surpreendi positivamente pois todos os comandos e downloads de ferramentas externas funcionaram com fluidez. O ambiente em si não é muito complicado de entender e não é muito pesado, algo que conta muito especialmente considerando que meu computador é bastante antigo.

O Colab me fez perder um pouco do ranço que tenho de ferramentas Google — mais pelo modelo de negócios predatório dessa big tech do que pelas ferramentas em si — e espero que seja o suficiente para continuarmos com as atividades do projeto até o final.


© 2022 Paulo Ewerton CC BY-NC-ND 4.0