[Ubuntu-BR] problema com * character encoding* e ativacao ultraedit **trial**

julio menezes yjmenezes em yahoo.com.br
Quarta Junho 22 14:03:57 UTC 2011


Ubunteiros

Acredito que todos devam passar por problemas de codificacao de caracteres.
A MS utiliza codificacao propria WIN-1252 ou CP1252 que apresenta diferencas com o *padrao* ISO-8859-1, sendo um *super-set* do ISO.
Existe o padrao UNICODE e os sistemas *nix usam UTF-8.

1- Caracter estranho:

Ontem recebi um arquivo TXT processado com um software para windows.
Nele havia um caracter, visualmente parecia como um traco de *menos*.

Aqui esta ele.

NATPR285−SAT02 

Este caracter eh uma sequencia de 3 bytes. '\342''\210''\222'

Perdi um baita tempo para descobrir porque um script meu com * dos2unix, awk,sed *  nao funcionava corretamente.

Para descobrir o que havia de errado, suspeitei de caracter de controle.
Instalei o editor **uex** para ver os valores binarios.  

* uex== UltraEdit is a text, hex, and programming language editor.*

Com ele vi os 3 danadinhos e corrigi meus scripts.

Desculpem me por me alongar na descricao e ja alongando :-(.

2- UltraEdit: Aqui foi uma surpesa, pela primeira vez instalo um software de repositorio, esta no *Canonical Partners ( parceiros )*, que emite mensagem de **trial**. Vou usar pelos 30 dias e ver quando expirar o prazo.


3- Nomes de arquivos:
Com relacao a nomes de arquivos, tenho usado o *detox* e o *cnvmv* mas sempre resta alguma operacao manual de acerto.


4- Finalmente:

Se alguem tem alguma dica funcional para tratar codificacao em texto e nome de arquivos eu agradeco.

obrigado,

julio

















More information about the ubuntu-br mailing list