Informática, Bases de datos
Traballando con texto. Como determinar a codificación do ficheiro
Imos descubrir o que codificación de ficheiro. Simplificando, a codificación é considerado como un conxunto de caracteres de dous bytes, o que corresponde á letra do alfabeto nun idioma específico. Cada idioma ten a súa propia secuencia específica de codificación de símbolos. Ás veces hai unha necesidade de especificar a codificación. Considero isto como un exemplo dun documento de texto.
O que cómpre
Un conxunto de software específico. Para comezar, escriba aplicacións Word, KWrite, o navegador Firefox e ferramentas de recoñecemento - enca.
Determinar a codificación do ficheiro, pode usar o editor Microsoft Word xenérico. Primeiro, ten que instala-lo a partir do Office. Cando a aplicación se instala, e pode ser aberto por medio de iconas símbolo W no escritorio, vaia á seguinte etapa.
A seguinte etapa do recoñecemento
A través das aplicacións na barra de navegación, á súa vez vai a "File" - "Open". O mesmo se pode facer mediante unha combinación de teclado Ctrl + O.
A continuación, na caixa de diálogo, seleccione o directorio e, en realidade, un ficheiro para leitura. Seleccione co rato, fai clic no "descubrimento".
Cando un conxunto de arquivos partidas son CP1251, a aplicación tenta determinar a súa propia codificación. unha lista de posibles coincidencias serán mostrados. O conxunto proposto de caracteres á dereita da lista, seleccione unha das codificacións. Se a elección é feita correctamente, a elementos "mostra" aparecen texto recoñecido.
Como para determinar a través de codificación KWrite
Ademais do pre-procesador para procesamento de texto, Word, hai outra utilidade funcional. Un deles - KWrite (analóxico para UNIX-sistemas). Entón non está confuso, sinal para os puntos da tarefa "para determinar a codificación do documento en KWrite».
- Baixo a presentar unha proposta coa extensión .txt.
- codificacións busto, mentres que un deles sería axeitado.
- Executa o paso 2, vaia á opción de menú ferramentas na codificación.
navegador Mozilla Firefox, o obxectivo é o mesmo - para determinar a codificación de caracteres
O principio é o mesmo que en utilidades para traballar con texto. Executa o teu navegador instalar para realizar, e se non está instalado - a descarga do instalador do mozilla.org.
Entón tes que para abrir un documento de texto nunha xanela aberta, a través do menú "Arquivo", submenú "Abrir ficheiro". Se o ficheiro seleccionado é exhibido sen distorsión, eo texto lexible, definir a codificación non é difícil.
Para iso, vaia a "View" - "codificación", non aparece algúns conxuntos de caracteres, e un deles, diante do cal está o "Tick", e hai unha certa codificación de navegador.
Se o texto non é recoñecido correctamente, seleccione "Consideracións adicionais", experimento con el codificacións ou seleccione "Auto".
software especializado - estamos a traballar con enca
Hai unha serie de medios electrónicos auxiliares, facendo posible definir a codificación do texto.
Para aqueles que están afeitos a traballar baixo o UNIX, utilidade enca axeitado. Pode ser instalado utilizando o servizo "Xestor de paquetes". Buscar unha categoría paquete accesible, pode proceder a instalar o software.
Para ver a lista de idiomas de recoñecemento, executa enca linguas --list, usando o terminal.
Se desexa definir a codificación do ficheiro de texto tras a tecla (g), escriba un nome e logo, a posibilidade (L) do mesmo xeito, escriba o idioma de recoñecemento:
enca L /home/vic/temp/myfile.txt G rusa.
Para resumir o conxunto anterior
Eu creo que as utilidades enriba será suficiente para o usuario un conxunto de ferramentas para a decodificación de documentos de texto.
Ata o momento, en realidade, é todo sobre como recoñecer a codificación. Para os efectos da normativa, penso eu, o software é bo. Existen tamén métodos máis especializados de determinación, pero que están fóra do ámbito deste artigo.
Para Microsoft Word recoñecemento fonte do programa pode ser un texto tan sinxelo e documentos con formato complexa.
Similar articles
Trending Now