Главная страница > Вопрос
Вопрос
Помогите понять ошибку. Что же ему не нравится?
Пишу примитивный код на питоне. И при чтении файла возникает ошибка. Файл здоровенный. С русскими буквами.

Python 3.1.1 (r311:74483, Aug 17 2009, 17:02:12) [MSC v.1500 32 bit (Intel)] on win32
Type "copyright", "credits" or "license()" for more information.
>>> f = open("D:\\1\\article209.htm")
>>> f.readline()
Traceback (most recent call last):
 File "<pyshell#1>", line 1, in <module>
   f.readline()
 File "C:\Python31\lib\encodings\cp1251.py", line 23, in decode
   return codecs.charmap_decode(input,self.errors,decoding_table)[0]
UnicodeDecodeError: 'charmap' codec can't decode byte 0x98 in position 5988: character maps to <undefined>


программирование | python 19.10.09 Автор: TEMHbIU
Ответы
1 из 6
Я только на Бейсике могу ошибку найти
19.10.09 Автор: swt
2 из 6
Хммм. У меня был такой гемморой с кодировками.
Скажи-ка, а если не пытаться выводить в консоль, а присваивать переменной - читает?
19.10.09 Автор: Vindicar
3 из 6
проблема с заглавной русской буквой "И" ?
проверьте  eclipse ...
19.10.09 Автор: Без имени
4 из 6
Так, а в какой кодировке входной файл? у вас он явно пытается прочитаться как cp1251.
19.10.09 Автор: Vindicar
5 из 6
Сохрани в utf-8 и добавь в начало файла:
# -*- coding: utf-8 -*-
19.10.09 Автор: agronom
6 из 6
Во-первых, открывать файл всё же стоит для чтения (явно указывая). Т.е.
f = open("D:\\1\\article209.htm","r")
Во-вторых, инициируйте правильный кодек:
import codecs
В-третьих, открывайте файл так:
f = codecs.open("D:\\1\\article209.htm", "r", "utf-8")
19.10.09 Автор: Андрей Санитаров
Это может быть интересно
bash
Помогите в Pascal
Не запускается цикл программы на C#.
Что это за ошибка: [IOErrorEvent type="ioError" bubbles=false cancelable=false eventPhase=2 text="Error #2032"]?
ошибка Argument 'Length' must be greater or equal to zero
Войти
Просмотреть Вопросы и ответы в версии: для мобильных устройств | для ПК
©2014 Google - Политика конфиденциальности - Справка