Remover acentos com o sed ou o iconv (GNU/Linux)

Por vezes é útil remover acentos de um texto ou de palavras. Para tal podemos utilizar o sed, que normalmente já está instalado no GNU/Linux.

Basta criar um ficheiro como o seguinte...

#!/bin/sed -f

# Este programa remove os acentos, funciona tanto para espanhol como para
# português.
#
# Exemplo de utilização
# $ echo 'Eles também têm tempo.' | ./remover-acentos.sed

# Em maiúsculas
s/Á/A/g
s/É/E/g
s/Í/I/g
s/Ó/O/g
s/Ú/U/g

s/À/A/g

s/Ã/A/g
s/Õ/O/g

s/Â/A/g
s/Ê/E/g
s/Ô/O/g


# Em minúsculas
s/á/a/g
s/é/e/g
s/í/i/g
s/ó/o/g
s/ú/u/g

s/à/a/g

s/ã/a/g
s/õ/o/g

s/â/a/g
s/ê/e/g
s/ô/o/g

Dar-lhe permissão para executar (sudo chmod u+x remover-acentos.sed) e, depois, executar algo como echo 'Eles também têm tempo' | ./remover-acentos.sed, que retirará os acentos da frase, deixando-a assim: «Eles tambem tem tempo». Podemos passar qualquer texto para o programa através de um tubo. Assim, cat texto.txt | ./remover-acentos.sed removeria os acentos do texto no ficheiro texto.txt.

Outra opção é converter o texto para ASCII por transliteração com o programa iconv, que também está normalmente instalado no GNU/Linux. Assim, para converter um texto para ASCII, simplesmente tens de executar algo como iconv -f utf-8 -t ascii//translit texto.txt ou echo 'Não é uma árvore' | iconv -f utf-8 -t ascii//translit.

Os estúpidos códigos QR en restaurantes

Antes era comum ir a um restaurante, olhar para o menu e encomendar: era tão simples como isso. Agora muitos lugares já nem sequer têm um menu físico; assumem que o cliente tem um telefone «inteligente» e uma ligação à Internet. Se for este o caso, espera-se que o cliente utilize a câmara e digitalize o código QR, o que o leva a uma página web que não respeita a privacidade, leva frequentemente muito tempo a carregar e, em muitos casos, não é muito intuitiva.

É ineficiente, polui mais

O carregamento de uma página web com imagens num servidor remoto, para cada cliente, é poluente. Com um menu físico, não se desperdiça electricidade, as pessoas podem reutilizar o menu indefinidamente... Se não houver Internet ou se não tiveres bateria, como consultar o menu com o QR?

Sem privacidade

Quando visitamos um sítio web, deixamos uma pegada digital. Se utilizarmos códigos QR para consultar o menu, há empresas, governos, etc., que podem saber que num momento específico consultámos o menu de um restaurante específico.

Os clientes também perdem a sua privacidade quando pagam com cartão em vez de usarem dinheiro, mas isso é outra questão.

Melhor sem QR

Eu não tenho um telemóvel «inteligente» e não gosto de restaurantes. Se eu comer num restaurante, peço o menu físico. Se não mo derem, têm de me dizer, porque não tenho forma de ver o código QR. A maioria da comida dos restaurantes não é saudável, os trabalhadores são frequentemente explorados, muita comida é desperdiçada, há poucas opções veganas, etc. A indústria da hospitalidade tem muitos problemas. A utilização do código QR para menus é apenas mais um passo na direcção errada, mas muito fácil de combater, recusando-se a utilizar um telefone «inteligente» para digitalizar um estúpido código QR.

Como destruir o Google

O modelo empresarial do Google é baseado na recolha dos dados pessoais dos utilizadores, na sua venda a terceiros e na sua veiculação de anúncios. A empresa também se envolve em programas de espionagem, desenvolve programas de inteligência artificial para fins militares, explora utilizadores...

É uma das empresas mais poderosas do planeta. No entanto, o Google é um gigante com pés de barro que pode ser aniquilado.

Acabar com as suas receitas publicitarias

O Google ganha dinheiro ao servir anúncios personalizados com base nas informações que recolhe dos seus utilizadores. Se as pessoas não vêem anúncios, o Google não ganha dinheiro. O bloqueio de anúncios é uma forma de impedir o rastreio e fazer o Google perder dinheiro, mas se visitar as páginas do Google, o Google continuará a obter informações que pode vender aos anunciantes. Portanto, a coisa mais fácil a fazer é bloquear os anúncios.

Outra ideia é clicar em todos os anúncios com a extensão AdNauseam, que também os esconde de nós para que não os achemos irritantes. Este método significa que a Google ganha menos dinheiro com os cliques dos anúncios e que os servidores do Google têm um pouco mais de carga de trabalho (mínimo, mas isso aumenta os seus custos).

Encher os servidores do Google de porcaria

O Google permite-te carregar quase tudo nos seus servidores (vídeos, ficheiros, etc.). Se o conteúdo carregado para os seus servidores ocupa muito espaço e é lixo que afasta as pessoas dos seus serviços (vídeos com vozes de robôs a dizer disparates, centenas de vídeos com ruído que ocupam gigas e gigas), o custo de manutenção dos servidores aumenta e o lucro da empresa é reduzido.

Se este for um esforço coordenado globalmente por vários utilizadores, a Google teria de começar a restringir os carregamentos, contratar pessoas para encontrar vídeos de lixo, bloquear pessoas e endereços IP, etc., o que aumentaria as suas perdas e reduziria os seus lucros.

Por exemplo, posso criar vídeos de 15 minutos por hora e carregá-los para o YouTube automaticamente ou semi-automaticamente. Os vídeos devem ocupar muito espaço. Quanto mais resolução, mais cores, mais variedade de som, mais quadros por segundo, mais dinheiro o YouTube vai gastar para manter esses vídeos nos seus servidores.

O vídeo que mostro abaixo foi gerado automaticamente com ffmpeg. Tem apenas dois segundos de duração, mas ocupa 136 MB. Um vídeo semelhante de 15 minutos levaria 61,2 GB.

Continúa leyendo Como destruir o Google

xdg-open

xdg-open é um comando muito útil. Com ele podemos abrir qualquer programa ou URL a partir da linha de comandos. Se eu executasse xdg-open https://freakspot.net/pt, abriria a página principal desde sítio eletrônico com o meu navegador padrão e logo poderia executar outro comando. Uma desvantagem é que só lhe podemos passar um parâmetro, pelo que para abrir duas páginas web teríamos de correr xdg-open duas vezes.

Wget: baixar todos os arquivos de páginas web conforme expressão regular

Digamos que encontrámos uma página web que oferece muitos arquivos no formato PNG, MP3 ou que se chamam de uma certa maneira e queremos baixá-los. Se há muitos arquivos, fazer isto manualmente não é eficiente.

Com GNU wget podemos solucionar este problema de forma muito simples: só temos de executar um comando como o que segue.

Continúa leyendo Wget: baixar todos os arquivos de páginas web conforme expressão regular