admin / 27.07.2018

Кодирование текста онлайн

Version: 20180502

Universal Cyrillic decoder

Հայերեն — Башҡорт — БеларускаяБългарски — Иронау — Қазақша — Кыргызча — Македонски — Монгол
Нохчийн — O’zbekРусскийSlovenskyСрпскиТатарча — Тоҷикӣ — Українська — Чaваш — FrançaisEnglish



Please link to this site!

Donate via PayPal
You can help keeping the service running and without ads.

Donate Bitcoins

Custom Work
For a small fee I can help you quickly recode/recover large pieces of data — texts, databases, websites… or write custom functions you can use (invoice available).
Contact me! mailto:5ko [snail] 5ko [period] fr?subject=Request%20via%202cyr [period] com

About the program

Welcome! You may find this site useful, if you have recieved some texts that you believe are written in the Cyrillic alphabet, but instead are displayed in some strange combination of bizarre characters. This program will try to guess the encoding, and if it does not, it will show samples, examples of all encoding-combinations, so as you will be able to select the good one.

How to

  • Paste the text to decypher in the big text area. The first few words will be analysed so they should be (scrambled) in supposed Cyrillic.
  • The program will try to decypher the text and will print the result below.
  • If the translation is successful, you will see the text in Cyrillic characters and will be able to copy it and save it if it’s important.
  • If the translation isn’t successful (still the text is not in Cyrillic but in the same or other unintelligible characters), you can choose from the newly created select-listbox the variant that is in Cyrillic (if there are more than one, select the longest). By pressing the button OK you will have the correct text converted.
  • If the text is not totally converted, try all other variants in Cyrillic from the select-listbox.


  • If your text contains question marks «???? ?? ??????», the problem is with the sender and no recovery will be possible. Ask them to resend the text, eventually as an ordinary text file or in LibreOffice/OpenOffice/MSOffice format.
  • There is no claim that every text is decypherable, even if you are certain that the text is in Cyrillic.
  • The analyzed and converted text is limited to 100 KiB.
  • A 100% precision is not always achieved — in a conversion from a codepage to another code page, some characters may be lost, like the Bulgarian quotes or rarely some single letters. Some of this depends on your Windows Clipboard character handling.
  • The program will try a maximum of 6321 variants in two or three levels: if there had been a multiple encoding like , it will not be detected or tested. Usually the possible and displayed correct variants are between 32 and 255.
  • If a part of the text is encoded with one code page, and another part — with another code page, the program could recognize only one of the parts at a time.

Terms of use

Please notice that this freeware program is created with the hope that it would be useful, but has no warranty, not even an implied warranty for fitness for any particular use. Please use it at your own risk.

If you have very long texts to translate, please make sure you have a backup copy.

What’s new

  • October 2017 : Added «Select all / Copy» button.
  • July 2016 : SSL Certificate installed, you can now access the Decoder on a secure connection.
  • October 2013 : I am trying different optimizations for the system which should make the decoder run faster and handle more text. If you notice any problem, please notify me ASAP.
  • March 2013 : My hosting provider sent me a warning that the Decoder is using too much server CPU power and its processes were killed more than 100 times. I am making some changes so that the program will use less CPU, especially when reposting a previously sampled text, however, the decoded form may load somewhat slower. Please contact me if you have some difficulties using the program.
  • 2012-08-09 : Added French translation, thanks to Arnaud D.
  • 2011-03-06 : Added Belorussian translation, thanks to Зыль and Aliaksandr Hliakau.
  • 31.07.10 : Added Serbian translation, thanks to Miodrag Danilovic (Boston — Beograd).
  • 07.05.09 : Raised limit of MAX text size to 50 kiB.
  • may 2009 : Added Ukrainian interface thanks to Barmalini.
  • 2008-2009 : A number of small fixes and tweaks of the detection algorythm. Changed interface to default to automatic decoding.
  • 12.08.07 : Fixed Russian language translation, thanks to Petr Vasilyev. This page will be significantly restructured in the near future.
  • 10.11.06 : Three new postfilters added: «base64», «unix-to-unix» и «bin-to-hex», theoretically the tested combinations are 4725. Changes to the frequency analysis function (testing).
  • 11.10.06 : The main site is on a new hardware server, should run faster.
  • 11.09.06 : The program now uses PHP5 and should run times faster.
  • 19.08.06 : Because of a broken DNS entry, this site was inaccessible from 06:00 on 15 august up to 15:00 on 18 august. That was the reason for me to set two «mirror» sites ( and with the same program. If the original has a problem, you can find the copies in Google and recover your texts.
  • 17.06.06 : Added two more antique cyrillic encodings, MIK и KOI-7, but you better not need them.
  • 03.03.06 : Added Slovak translation, thanks to Martin from KPR Slovakia.
  • 15.02.06 : More encodings added and tested.
  • 20.10.05 : Small improvement to the frequency-analysis function: for texts, written in all-capital letters.
  • 14.10.05 : Two more gmail-cyrillic encodings were added. Theoretically the tested combinations are 2112.
  • 15.06.05 : Russian language interface was added. Big thanks to chAlx!
  • 16.02.05 : One more postfilter decoding is added, for strings like this: «%u043A%u0438%u0440%u0438%u043B%u0438%u0446%u0430».
  • 05.02.05 : More encodings tests added, the number of tested encodings is doubled, but thus the program may work slightly slower.
  • 03.02.05 : The frequency analysis function that detects the original encoding works much better now. Currently the program recognises most of the encodings if the first few words are not too weird. It although still needs some improvement.
  • 15.01.05 : The input text limit is raised from 10 to 20 kB.
  • 01.12.04 : First public release.

Back to the Latin to Cyrillic convertor.

Cамоучитель MS IE 6.0 → Настройка внешнего вида обозревателя → Русские кодировки

Русские кодировки

Россия, впрочем, как и всегда, пошла впереди планеты всей. У нас ведь всегда брали не качеством, а количеством. Итак, было создано несколько кодировок символов русского языка. А в большинстве стран была создана единая кодовая страница для своего алфавита, чтобы избежать путаницы.

С самого начала программное обеспечение, поставляемое в Россию из-за рубежа, не умело работать с русскими символами. То есть вместо того, чтобы написать "Привет Вася" приходилось "Privet Vasya". Итак, чтобы решить эту проблему была создана русская кодовая страница, получившая название ISO-8859-5. Как следует из вышесказанного, после 127 кода следовали русские буквы — всего 66 (33 прописных и 33 строчных).

Поэтому оставалось еще достаточно места для псевдографики, которая тогда использовалась крайне широко, ведь графических оболочек еще не существовало.

Примерно в это же время появилась еще одна кодовая страница — ср866. Она отличалась от ISO-8859-5 порядком следования русских букв до строчной "р", а символы псевдографики кодировались теми же кодами, что и в латинице. Соответственно, ее использование могло существенно упростить работу с нелокализованными версиями программ западных разработчиков, работающих с графикой. Например, для отображения таблицы. Поэтому, если в системе была установлена эта кодировка, графические объекты отражались верно. В противном случае, например, при установленной ISO-8859-5 рисовалась бы русская буква, вместо символа псевдографики, и такое изображение было бы неудобно просматривать.

Первой локализованной операционной системой стала MS-DOS 4.1 от корпорации Microsoft. При создании кодовой страницы была взята альтернативная ISO-8859-5 кодировка, впоследствии названная ср866. И так как все большее и большее распространение получали персональные компьютеры, кодировка ср866 стала самой популярной.

Дальше был Windows. И появилась еще одна кодировка Win-1251. Зачем? Отпала необходимость использования псевдографики. Поэтому вместо нее были встроены специальные символы: @, *, &,^ и т. д. Но возникла новая проблема. Текст, набранный в кодировке ср866, уже нельзя было прочитать. Поэтому появились программы-перекодировщики.

На персональных компьютерах повсеместно была установлена операционная система MS-DOS с кодовой страницей 866. На сетевых операционных системах все было иначе. В те годы начала свое победоносное шествие UNIX. А в ней кодировкой по умолчанию стала КОИ-8.

Зарождение Интернета происходило в Америке. Соответственно все веб, почтовые серверы предназначались для англоязычных пользователей. Так как использование графики (псевдографики) в почтовых сообщениях тогда не требовалось, расчет делался на первую половину таблицы символов (от О до 127) — семибитную кодировку.

В связи с этим, сообщения, содержащие символы с кодами, большими 127, которые было невозможно закодировать семью битами, такими почтовыми серверами обрабатываться не могли. Итак, для того чтобы решить эту проблему, придумали приводить такие сообщения к семибитному виду. Сам процесс был достаточно прост — обнулялся первый бит, указывавший на половину их кодовой страницы. И вот что получалось при таком преобразовании: русская буква "е" превращалась в "Г и т. д.

Выход был — сделать так, чтобы все почтовые серверы поддерживали восьмибитную кодировку символов.

Universal Cyrillic decoder

Но, к сожалению, осуществить это не представлялось возможным. Можно, конечно, было писать письмо не русскими символами, а транслитом. Но такое письмо было бы неудобочитаемым. Поэтому была придумана новая кодировка символов, которая впоследствии получила название КОИ-8. Итак, в ней на места, соответствующие кодам символов, большим 127, были поставлены русские символы, похожие по звучанию, произношению, на английские буквы. Например, "а" "б" "ц" и т. д., которые при семибитном преобразовании перешли бы в латинские "а" "b" "с".

Эта кодировка стала стандартом для UNIX-подобных операционных систем (Linux и т. д.) и используется по сегодняшний день.

Естественно, что пользователь обыкновенного персонального компьютера не мог или не хотел устанавливать ОС UNIX. Поэтому были созданы специальные программы, умеющие работать с различными кодировками. В дальнейшем эта способность была встроена практически во все приложения, тем или иным образом, связанные с сетью.

Кодировка КОИ-8 стала наиболее рекомендованной для переписки, поэтому любая почтовая программа должна была уметь работать с ней. То есть правильно отображать текст, набранный в ней.

Сейчас наиболее распространенные кодировки русскоязычного текста в Интернете — это КОИ-8 и Win. КОИ-8 — кодировка, используемая преимущественно в UNIX-подобных операционных системах. Например; Linux. Win же используется в ОС под управлением Microsoft Windows. Вы можете спросить: "А мне то что?" А все дело в том, что некоторые серверы расположены на компьютерах под управлением Windows, а некоторые — под управлением UNIX-подобной операционной системы. Соответственно кодировка русскоязычных символов различна.

К счастью, Microsoft Internet Explorer 6.0 обладает возможностью отображать веб-страницы, сохраненные в любой кодировке. Начиная с 5-й версии, обозреватель сам распознает и отображает в правильной кодировке веб-сайты.

В контекстном меню браузера (рис. 7.7) вы можете выбрать кодировку двумя способами:

Рис. 7.7. Выбор кодировки

Создать и расшифровать ASCII online

Пришло мне письмо с не читаемой кириллической кодировкой и встал вопрос о декодирование этой абракадабры в читаемый набор символов. Для этих целей под Windows есть хороший софт, который не раз помогал в таких случаях – Shtirlitz IV 4.01. Но в этот раз он не выдала даже приблизительно читаемый текст.

После непродолжительного googling around был найден Универсальный декодер кириллицы.

Вкратце о возможностях:

  1. Визуальный подбор исходной кодировки
  2. Программа проверяет максимум 4725 вариантов из двух и трех перекодировок: если имело место многократное перекодирование вроде koi8(utf(cp1251(utf))), оно не будет распознано или проверено. Если в вашем случае предполагается многократное преобразование – рекомендую воспользоваться выше упомянутым Shtirlitz, он иногда правильно понимает многократное преобразование.
  3. Если части текста закодированы в разных кодировках, программа сможет распознать только одну часть за раз.
  4. На преобразуемый текст есть ограничения – 20 Кб

Что сразу понравилось, так это комбобокс Выберите кодировку, в котором перечислен примерный вид исходного текста, т.е. не надо гадать какая правильная исходная и желаемая кодировка, а можно определить примерно по внешней последовательности символов.

Если в списке не было найдено примерно совпавшей кодировки можно воспользоваться Испробовать все комбинации. После нажатия кнопки OK страница перезагрузиться и в выпадающем списке можно будет просмотреть список всех возможных преобразований, среди них я нашел более-менее читаемый текст для своего случая. Правда, некоторые символы не были правильно преобразованы, но текст стал разборчивым и можно было понять смысл письма.

Есть возможность и полностью управляемого декодирования с выбором исходной кодировки, предполагаемой кодировкой и методом кодирования символов (Content-Transfer-Encoding для MIME).

Еще варианты:

blog comments powered by

Способы установки правильной кодировки страниц сайта

Для того, чтобы страницы вашего сайта отображались корректно во всех браузерах и на всевозможных устройствах, нужно позаботиться об установке правильной кодировки. Несоблюдение некоторых условий, о которых мы сегодня расскажем подробно, может привести к тому, что текст превратится в бессмысленный набор символов, прочитать которые просто невозможно (кракозябры).

Почему вместо нормального текста отображаются кракозябры

Каждая страница вашего сайта должна иметь определенную кодировку. О том, какая кодировка используется в данный момент необходимо сообщать браузеру, передавая специальные заголовки (header). В этих заголовках необходимо указать кодировку, соответствующую той, которую вы используете в теле документов, размещенных на сайте (на его страницах).

Современные браузеры могут и сами определить кодировку документа, если вебмастер забыл указать ее в явном виде.

Калькулятор кодов онлайн.

Иногда случается так, что возникают несостыковки между «мнением» браузера и реальностью, отсюда и появляется набор символов, которые невозможно прочитать. Набор галиматьи может принимать разные виды, иногда это будут просто странные символы, похожие на древние иероглифы, а иногда — просто вопросики или же вопросики внутри черных ромбиков. По большому счету не так важно, какие именно кракозябры отображает браузер, а важно то, что человек их прочитать не может.

Если же вы столкнулись с проблемой некорректно указанной кодировки и видите на своем сайте то, что не в состоянии прочитать, в первую очередь воспользуйтесь специальным Декодером, разработанным в студии Артемия Лебедева. Для этого просто скопируйте текст, который хотите расшифровать, вставьте его в специальное поле и нажмите «Расшифровать». В случае успешного декодирования, вы увидите уже читаемый текст, а также исходную кодировку и путь, который пришлось пройти программе, чтобы вывести результат.

Все это нужно, скорее, для продвинутых пользователей, которым полученная информация сможет чем-то помочь. Возможно, результат действий программы натолкнет вас на мысль и вы сообразите, откуда на вашем сайте берутся кракозябры и быстро исправите ситуацию. А если же проделанные манипуляции совершенно ни о чем вам не говорят, то давайте просто двигаться дальше.

Как правильно выбрать кодировку

В рамках данной статьи мы не будем углубляться в то, какие кодировки бывают и чем они друг от друга отличаются, т.к. не хотим перегружать ни себя, ни вас лишней информацией, да и в целях сегодняшней статьи этого не было. Стоит отметить лишь тот факт, что на русскоязычном сайте нет совершенно никакого смысла устанавливать кодировку windows-1251, исчерпывающе описанную в замечательной статье Википедии. Даже если все тексты на нем будут написаны исключительно на русском и не будет никаких вкраплений нестандартных символов. Вместо этого нужно просто выбрать универсальную кодировку UTF-8, приняв это как данное, не забивая голову лишней информацией.

Дело в том, что нет смысла выбирать для своего сайта кодировку, которая поддерживает одни только символы славянских языков, таких как русский, украинский, белорусский, сербский, македонский и болгарский. Зачем изначально ограничивать себя и обрекать на возможные проблемы в дальнейшем. Что вы будете делать, если понадобится вставить символ, которого нет в поддерживаемых?

UTF-8 (от англ. Unicode Transformation Format) — восьмибитный формат преобразования Юникода, который получил всемирное признание и был стандартизирован как раз для избежания проблем, связанных с появлением кракозябров и неразберихой с нечитабельными текстами. Из чего можно смело сделать вывод, что в данном случае из двух зол нужно выбирать бóльшую и спать спокойно, не вникая в подробности, потому что тут и так все понятно. Посмотрите на размер Юпитера и Венеры для сравнения.

Основные способы установки правильной кодировки

Довольно часто проблемы с кодировкой сайта возникают не потому что не было выполнено ни одного из условий, о которых мы вам сейчас расскажем, а достаточно не выполнить всего лишь одно из них, чтобы текст на вашем сайте начал отображаться некорректно. После того, как вы установите кодировку всеми перечисленными способами, задача будет решена с вероятностью 99.9%. К такому заключению мы пришли на основании многолетнего опыта работы с сайтами на всевозможных хостинг-площадках, с использованием самых разных систем администрирования и настроек серверов.

Кодировка в .htaccess — AddDefaultCharset

Прежде всего, вам нужно установить кодировку всех страниц сайта по умолчанию с помощью одной очень полезной директивы htaccess — AddDefaultCharset, которая в дословном переводе с английского языка означает «ДобавитьКодировкуПоУмолчанию». Делается это очень просто:

AddDefaultCharset UTF-8

Если вы не знаете что такое .htaccess, то просто создайте текстовый файл в блокноте, а затем с помощью Total Commander-а переименуйте его в файл без названия, имеющий расширение HTACCESS (.htaccess — именно так и должно выглядеть полное имя вашего файла). После этого закачайте только что созданный файл в корневую директорию вашего сайта (в то же место, где находится главный исполняющий файл, например index.php). И не забудьте вставить строку с кодировкой по умолчанию, которую мы только что приводили.

Кодировка с помощью meta charset

Метатеги способны отсылать браузеру информацию о странице в виде специальных заголовков, одним из которых как раз является тот, что нам нужен — charset. Вообще метатеги могут иметь аж 4 различных атрибута:

  1. content;
  2. http-equiv;
  3. name;
  4. scheme.

На самом деле, из представленных четырех атрибутов только один является обязательным — content, но существуют и исключения. Например в нашем случае будет использоваться сокращенная версия записи и мы установим кодировку с помощью метатега именно так:

<meta charset="utf-8">

Старый же формат записи давно канул в Лету и использовать его больше смысла нет:

<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

Как известно, метатеги принято размещать внутри контейнера head. Об этом, наверное, знают уже все без исключения.

Проделайте эту операцию и мы перейдем к следующему пункту в нашем списке.

Кодировка файла с помощью функции header PHP

Данный способ подойдет лишь тем, у кого сайт реализован с помощью самого популярного на данный момент языка программирования, по большей части ориентированного на создание веб-сайтов — PHP (Hyper Text Preprocessor). Для решения задачи, поставленной в рамках данной статьи, мы воспользуемся замечательной встроенной функцией header(), предназначенной для передачи заголовков, аналогично метатегам, но с тем небольшим отличием, что действие производится из PHP-скрипта, а не посредством вывода HTML-кода.

Установить кодировку UTF-8 для файла при помощи функции header() довольно просто — нужно просто вставить приведенный код в самое начало страницы, но разумеется внутри области действия PHP, которая обозначается так: <? здесь у нас PHP-код ?> или же так — <?php здесь у нас PHP-код ?>.

header(«Content-type: text/html; charset=utf-8»);

Самым важным моментом здесь является то, что заголовки мы имеем право передавать только в том случае, если перед этим не было никакого вывода со стороны скрипта. Именно поэтому мы вставляем данный код в самое начало страницы. Делать это нужно с умом и хорошо понимать, что происходит, ведь вы можете быть уверены, что вставляете заголовок в начало файла, но можете не знать, что этот файл используется в другом файле, в который подтягивается с помощью функции require или include уже после того, как определенная информация была выведена на экран. Поэтому если вы не очень хорошо понимаете о чем сейчас идет речь, лучше перейдите к следующему шагу и вернитесь к этому, если 3 предыдущих не помогли установить правильную кодировку страниц вашего сайта.

Сохранение файлов в правильной кодировке

Одной из, наверное, самых распространенных причин возникновения кракозябров на сайте является некорректное кодирование самих фалов, использующихся для генерации конечного документа. Чаще всего такая проблема возникает у начинающих программистов, которые только делают свои первые шаги в освоении искусства сайтостроения. Когда в качестве движка сайта выбрана одна из популярных на данный момент систем администрирования, данная проблема может возникать в очень редких случаях, но если используется самописный движок, то такое случается чуть ли не в каждом третьем случае.

Как мы условились ранее, используемая нами кодировка на всех, даже на самых прожженных русскоязычных сайтах — UTF-8, поэтому и все файлы, составляющие движок сайта мы с вами будем кодировать в этом же формате. А для того, чтобы изменить кодировку самого файла, закачиваемого на сервер, обычного блокнота, предоставляемого операционной системой Windows будет конечно же не достаточно. Поэтому лучше воспользоваться сторонней программой, распространяемой бесплатно — Notepad++, которую можно скачать на официальном сайте без особых проблем.

Успешно пройдя  несложный процесс установки, вы должны будете назначить эту программу редактором по умолчанию, произвести некоторые настройки на свой вкус и поменять кодировку некорректно отображаемого файла так же, как показано на скриншоте. Т.е. вам необходимо выбрать значение «Кодировать в UTF-8 (без BOM)». Хорошим признаком того, что причина была именно в этом, будет то, что изначально не будет выбран ни один из вариантов и вам будет предложено «Преобразовать в UTF-8 (без BOM)». Если вы это увидели, то будьте уверены, что до решения проблемы с кодировкой остались считанные секунды.

В дополнение хочется сказать лишь то, что выбирать нужно именно без BOM. В противном случае, если кодировать просто в UTF-8 (с BOM), то в начале файла будут создаваться лишние байты.

BOM — Byte Order Mark стараются не использовать именно в вебе при кодировании в формате UTF-8, т.к. это приводит к ошибкам из-за создания помех корректной PHP-интерпретации.

Ну а теперь, когда все необходимые действия выполнены, вы, скорей всего, на страницах вашего сайта увидите перед собой легко читаемый текст и вздохнете свободно 🙂




First, choose the language of the text you want to decode. An input form will appear.

If you ask yourself "how to decode a text?", email or ICQ message, this online decoder will help you to restore the unreadable text.

Paste your garbled text into the text area and press one of the buttons below. If you want to decode really large piece of text, note that only first 20'000 characters will be processed.

Although decoder manages to recover garbled texts quite well, in some rare cases pasted text can not be recovered or recovered fully. Mainly it is due to a possible loss of some encoding information while copying a text. Still decoder will suggest even partial translations.

Decoder also recognizes most popular email and web encodings like base64, quoted-printable, urlencoded, etc.


Decoder will try to decipher your «mojibake» into readable text in your chosen language.

Как декодировать текст онлайн

If you are not sure what is the best option, go for «Guess».


If you know the encoding/charset garbled text is displayed in as well as its original encoding/charset, choose both from the lists and press «Exact».


If you are translating a few pieces of text from the same source (for example, you have used «Guess» on a smaller fragment and now want to decode the whole text), go for this option. Decoder will use the last displayed encodings. This button is unavailable, if cookies are disabled in your browser.


When you choose «Guess» button first, a list of alternative decodings will be suggested. If you can not see the satisfying decoding in the main result area, choose another alternative from the list and press «Show» button.

Click to swap


Text в Hex / Hex в Text — преобразование текста в шестнадцатеричные коды его символов и обратно. Работает для текста в кодировках Windows-1251, UTF-16. Декодирует UTF-8 текст с кириллицей, который при закодировании в JSON переводится штатной php функцей json_encode() в \uXXXX кодировку.

В математике и вычислениях шестнадцатеричная (также базовая 16, или шестнадцатеричная) — это позиционная система счисления с основанием 16. Он использует шестнадцать различных символов, чаще всего символы 0-9 для представления значений от нуля до девяти, и A, B, C, D, E, F (или альтернативно a, b, c, d, e, f) для представления значений от десяти до пятнадцати.

Шестнадцатеричные цифры широко используются разработчиками компьютерных систем и программистами. Поскольку каждая шестнадцатеричная цифра представляет собой четыре двоичные цифры (биты), она позволяет более удобное для человека представление двоичных кодированных значений. Одна шестнадцатеричная цифра представляет собой кусочек (4 бита), который составляет половину октета или байта (8 бит). Например, один байт может иметь значения в диапазоне от 00000000 до 11111111 в двоичном виде, но это может быть более удобно представлено как 00 до FF в шестнадцатеричном виде.

Текстовый декодер онлайн: восстановление текста.

В контексте, не относящемся к программированию, индекс обычно используется, чтобы дать rix, например, десятичное значение 10,995 было бы выражено в шестнадцатеричном виде как 2AF316. Несколько обозначений используются для поддержки шестнадцатеричного представления констант в языках программирования, обычно включающих префикс или суффикс. Префикс «0x» используется в языках C и связанных языках, где это значение может быть обозначено как 0x2AF3.



Submit a Comment

Must be required * marked fields.