[Ubuntu-BR] problema com * character encoding* e ativacao ultraedit **trial**
julio menezes
yjmenezes em yahoo.com.br
Quarta Junho 22 14:03:57 UTC 2011
Ubunteiros
Acredito que todos devam passar por problemas de codificacao de caracteres.
A MS utiliza codificacao propria WIN-1252 ou CP1252 que apresenta diferencas com o *padrao* ISO-8859-1, sendo um *super-set* do ISO.
Existe o padrao UNICODE e os sistemas *nix usam UTF-8.
1- Caracter estranho:
Ontem recebi um arquivo TXT processado com um software para windows.
Nele havia um caracter, visualmente parecia como um traco de *menos*.
Aqui esta ele.
NATPR285−SAT02
Este caracter eh uma sequencia de 3 bytes. '\342''\210''\222'
Perdi um baita tempo para descobrir porque um script meu com * dos2unix, awk,sed * nao funcionava corretamente.
Para descobrir o que havia de errado, suspeitei de caracter de controle.
Instalei o editor **uex** para ver os valores binarios.
* uex== UltraEdit is a text, hex, and programming language editor.*
Com ele vi os 3 danadinhos e corrigi meus scripts.
Desculpem me por me alongar na descricao e ja alongando :-(.
2- UltraEdit: Aqui foi uma surpesa, pela primeira vez instalo um software de repositorio, esta no *Canonical Partners ( parceiros )*, que emite mensagem de **trial**. Vou usar pelos 30 dias e ver quando expirar o prazo.
3- Nomes de arquivos:
Com relacao a nomes de arquivos, tenho usado o *detox* e o *cnvmv* mas sempre resta alguma operacao manual de acerto.
4- Finalmente:
Se alguem tem alguma dica funcional para tratar codificacao em texto e nome de arquivos eu agradeco.
obrigado,
julio
More information about the ubuntu-br
mailing list