InformáticaBases de datos

Traballando con texto. Como determinar a codificación do ficheiro

Imos descubrir o que codificación de ficheiro. Simplificando, a codificación é considerado como un conxunto de caracteres de dous bytes, o que corresponde á letra do alfabeto nun idioma específico. Cada idioma ten a súa propia secuencia específica de codificación de símbolos. Ás veces hai unha necesidade de especificar a codificación. Considero isto como un exemplo dun documento de texto.

O que cómpre

Un conxunto de software específico. Para comezar, escriba aplicacións Word, KWrite, o navegador Firefox e ferramentas de recoñecemento - enca.

Determinar a codificación do ficheiro, pode usar o editor Microsoft Word xenérico. Primeiro, ten que instala-lo a partir do Office. Cando a aplicación se instala, e pode ser aberto por medio de iconas símbolo W no escritorio, vaia á seguinte etapa.

A seguinte etapa do recoñecemento

A través das aplicacións na barra de navegación, á súa vez vai a "File" - "Open". O mesmo se pode facer mediante unha combinación de teclado Ctrl + O.

A continuación, na caixa de diálogo, seleccione o directorio e, en realidade, un ficheiro para leitura. Seleccione co rato, fai clic no "descubrimento".

Cando un conxunto de arquivos partidas son CP1251, a aplicación tenta determinar a súa propia codificación. unha lista de posibles coincidencias serán mostrados. O conxunto proposto de caracteres á dereita da lista, seleccione unha das codificacións. Se a elección é feita correctamente, a elementos "mostra" aparecen texto recoñecido.

Como para determinar a través de codificación KWrite

Ademais do pre-procesador para procesamento de texto, Word, hai outra utilidade funcional. Un deles - KWrite (analóxico para UNIX-sistemas). Entón non está confuso, sinal para os puntos da tarefa "para determinar a codificación do documento en KWrite».

  1. Baixo a presentar unha proposta coa extensión .txt.
  2. codificacións busto, mentres que un deles sería axeitado.
  3. Executa o paso 2, vaia á opción de menú ferramentas na codificación.

navegador Mozilla Firefox, o obxectivo é o mesmo - para determinar a codificación de caracteres

O principio é o mesmo que en utilidades para traballar con texto. Executa o teu navegador instalar para realizar, e se non está instalado - a descarga do instalador do mozilla.org.

Entón tes que para abrir un documento de texto nunha xanela aberta, a través do menú "Arquivo", submenú "Abrir ficheiro". Se o ficheiro seleccionado é exhibido sen distorsión, eo texto lexible, definir a codificación non é difícil.

Para iso, vaia a "View" - "codificación", non aparece algúns conxuntos de caracteres, e un deles, diante do cal está o "Tick", e hai unha certa codificación de navegador.

Se o texto non é recoñecido correctamente, seleccione "Consideracións adicionais", experimento con el codificacións ou seleccione "Auto".

software especializado - estamos a traballar con enca

Hai unha serie de medios electrónicos auxiliares, facendo posible definir a codificación do texto.

Para aqueles que están afeitos a traballar baixo o UNIX, utilidade enca axeitado. Pode ser instalado utilizando o servizo "Xestor de paquetes". Buscar unha categoría paquete accesible, pode proceder a instalar o software.

Para ver a lista de idiomas de recoñecemento, executa enca linguas --list, usando o terminal.

Se desexa definir a codificación do ficheiro de texto tras a tecla (g), escriba un nome e logo, a posibilidade (L) do mesmo xeito, escriba o idioma de recoñecemento:

enca L /home/vic/temp/myfile.txt G rusa.

Para resumir o conxunto anterior

Eu creo que as utilidades enriba será suficiente para o usuario un conxunto de ferramentas para a decodificación de documentos de texto.

Ata o momento, en realidade, é todo sobre como recoñecer a codificación. Para os efectos da normativa, penso eu, o software é bo. Existen tamén métodos máis especializados de determinación, pero que están fóra do ámbito deste artigo.

Para Microsoft Word recoñecemento fonte do programa pode ser un texto tan sinxelo e documentos con formato complexa.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 gl.delachieve.com. Theme powered by WordPress.