книги
Найдено: 9 записей
Песочница →
Мини web-краулер. Качаем книгу из интернета
Преамбула
Поскольку большинство книг я читаю с наладонника, книги нужно где-то качать. Большинство интересующих меня книг можно найти в сетевых библиотеках в формате txt, html, fb2 или другом текстовом. Бывают случаи, когда книга разделена на несколько страниц и лежит на каком-нибудь сайте, где возможность скачать целиком не предусмотрена. В этом случае можно сохранить каждую html страницу вручную, но такой способ имеет два важных недостатка. Во-первых, если книга разделена на 15-20 страниц, сохранение вручную займёт много времени и будет раздражать. Во-вторых, вместе с текстом книги мы получим кучу всякого мусора — текст, не относящийся к книге, таблицы, скрипты, ссылки на другие сайты и прочую муть.
Чтобы упростить себе жизнь, мы напишем программу, которая скачает книгу для нас. Из сказанного выше следует, что нам нужна программа, которая: а) скачает в нужном порядке все страницы, по которым разбросана книга; б) с каждой страницы возьмёт только тест и ничего лишнего и в) сохранит весь текст книги в одном html-файле.
В качестве примера мы возьмём книгу Владимира Плунгяна «Почему языки такие разные. Популярная лингвистика». Я нашёл только одну сетевую бибилотеку, где её можно скачать в текстовом формате, да и там требуется регистрация, поэтому мы скачаем её по указанной ссылке с помощью программы, о которой речь пойдёт дальше. Для написания программы мы используем язык программирования Python. Я использовал Python версии 2.6. Эту или более новую версию можно скачать бесплатно на официальном сайте.
Поскольку большинство книг я читаю с наладонника, книги нужно где-то качать. Большинство интересующих меня книг можно найти в сетевых библиотеках в формате txt, html, fb2 или другом текстовом. Бывают случаи, когда книга разделена на несколько страниц и лежит на каком-нибудь сайте, где возможность скачать целиком не предусмотрена. В этом случае можно сохранить каждую html страницу вручную, но такой способ имеет два важных недостатка. Во-первых, если книга разделена на 15-20 страниц, сохранение вручную займёт много времени и будет раздражать. Во-вторых, вместе с текстом книги мы получим кучу всякого мусора — текст, не относящийся к книге, таблицы, скрипты, ссылки на другие сайты и прочую муть.
Чтобы упростить себе жизнь, мы напишем программу, которая скачает книгу для нас. Из сказанного выше следует, что нам нужна программа, которая: а) скачает в нужном порядке все страницы, по которым разбросана книга; б) с каждой страницы возьмёт только тест и ничего лишнего и в) сохранит весь текст книги в одном html-файле.
В качестве примера мы возьмём книгу Владимира Плунгяна «Почему языки такие разные. Популярная лингвистика». Я нашёл только одну сетевую бибилотеку, где её можно скачать в текстовом формате, да и там требуется регистрация, поэтому мы скачаем её по указанной ссылке с помощью программы, о которой речь пойдёт дальше. Для написания программы мы используем язык программирования Python. Я использовал Python версии 2.6. Эту или более новую версию можно скачать бесплатно на официальном сайте.
10.03.2012 01:36+0400
Реклама →
ЛитТайм.ру – лента книжных новинок
Здравствуйте, друзья. Вроде бы стоит взять пафосную ноту и рассказать о своем мега-проекте, но не получается. Я хочу просто рассказать вам о своем проекте, которым занимался почти 3 года (историю оставлю на потом). Точнее о его первой готовой ступени – ленте выходящих в разных издательствах книг. Пишу потому, что уже кому-то из вас она уже может оказаться полезной. Итак, LitTime.ru
31.01.2012 08:48+0400
Реклама →
Книгобаза — родилась бета
Доброе время суток, хотелось бы рассказать немного о новом проекте — Книгобаза
Сейчас проект находится в бета версии, многое еще не доделал, но основной функционал уже работает.
Вся база — это агррегатор других книжных сайтов — озон, имхонет, флибуста, etc… (если нужен какой-то еще, пишите — добавлю)
Хочется получит хороший фидбек по проекту, и стоит ли продолжать?
Книгобаза почти полностью копирует Кинобазу (они знают:)), проект делается ради удовольствия, пишу медленно и обдумывая:) Работает все на python+twisted база Mysql, поиск/фильтр — sphinx.
До этого работал с twisted но не в вебе (arx-боты, возможно кто-то встречался). Вообще этим фреймворком доволен как слон:)
Сейчас проект находится в бета версии, многое еще не доделал, но основной функционал уже работает.
- На книгобазе можно хранить свою библиотеку, отмечая книги которые прочитал, хочешь читать или вообще не хочешь даже видеть в каталоге.
- Есть удобный поиск/фильтр книг, по рейтингу, источнику, автору, издательству… и много других параметров.
Вся база — это агррегатор других книжных сайтов — озон, имхонет, флибуста, etc… (если нужен какой-то еще, пишите — добавлю)
Хочется получит хороший фидбек по проекту, и стоит ли продолжать?
Книгобаза почти полностью копирует Кинобазу (они знают:)), проект делается ради удовольствия, пишу медленно и обдумывая:) Работает все на python+twisted база Mysql, поиск/фильтр — sphinx.
До этого работал с twisted но не в вебе (arx-боты, возможно кто-то встречался). Вообще этим фреймворком доволен как слон:)
09.12.2011 10:27+0400
Реклама →
LiveKniga.Ru, или Рассказ о блоге с рассказами о рассказах
Несколько недель назад я объяснялся на Хабре в своей любви к электронным читалкам. Где-то в статье я упомянул свой небольшой сайт LiveKniga.Ru с рецензиями на прочитанные книги и был приятно удивлён тем, что многие заинтересовались этим сайтом даже больше, чем моими могучими аргументами в пользу читалок. :) Несмотря на то, что ссылка была незаметной и расположена под катом, трафика было много, и мне пришлось немного поволноваться за свой сервер. Слава богу, испытание хабраэффектом было с блеском выдержано, и я подумал, почему бы когда-нибудь не рассказать чуть подробнее об этом сайте (естественно, в соответствующем блоге). И вот сегодня «когда-нибудь» настало.
Помимо чисто маркетинговых целей, возможно, заурядная история этого сайта будет интересна тем, кто хочет запустить или лишь недавно запустил свой тематический блог. Никакой success story или назидательности не ждите — это cool story bro в чистом виде.
01.11.2011 11:32+0400
Реклама →
FFFFields.tk – вкусы по сферам занятости
Я заметил, что довольно часто узнаю о классных фильмах или книгах из комментариев на хабре. Не менее качественным источником рекомендаций для меня оказался круг коллег-разработчиков и дизайнеров на работе. Будучи студентом университета нередко получал рекомендации по художественной литературе от профессоров и магистров. С другой стороны, топик «любимые фильмы» на городском форуме хорошего принес мало: пишущих туда объединяет лишь название города проживания, в остальном это слишком разные люди.
10.10.2011 13:08+0400
Песочница →
HTML5 путеводитель
HTML5 еще не закончен, но об этом уже существует множество книг. Книги, написанные об HTML5 в 2010 году, в большинстве своем, содержат не актуальную на данный момент информацию. Именно поэтому я расскажу о книгах 2011 и 2012 годов для начинающих.
20.09.2011 17:52+0400
Реклама →
Приложение «Книгообмен»
Книги я всё еще читаю бумажные. Полезные, интересные, скучные, умные, глупые, в любом случае это становится понятно только после их прочтения. Какие-то книги постоянно перечитываешь, другие хороши, только первый раз, есть и такие, которые хочется сжечь. Так или иначе, книжные полки в квартире не резиновые, и со временем начинаешь задумываться куда деть свои прочитанные книги, которые, к слову, кому-нибудь могут оказаться очень нужны и интересны.
20.06.2011 10:56+0400
Научно популярное →
«Фрикономика» Левитта: закон непредвиденных последствий
«Зри в корень»
Козьма Прутков
Рассказ о прогремевшей на весь мир книге — такой как "Фрикономика" — положено начинать с перечисления регалий. Бестселлер «Амазона», прекрасные отзывы в прессе, автор — профессор, лауреат…
Почему такой аннотации не хватит, чтобы вы сочли эту книгу достойной своего внимания?
Все мы знаем, чего стоят эти оценки и премии. Порой они заслужены «без дураков» — но зачастую все плюшки достаются произведению, которое не представляет из себя ничего выдающегося, а всего лишь оказалось в нужное время в нужном месте. Вспомним нашумевший опус про «афедрон»: как вышло, что объективно некачественный роман получил значительную литературную премию? И только ли в литературе нужно искать корни этого явления?
Стивен Левитт, автор «Фрикономики», прославился открытиями таких неочевидных причин. Он перелопачивает груды статистических данных, опрашивает людей; словно Шерлок Холмс, анализирует, сопоставляет — и выдает блестящее решение задачи, о самом существовании которой догадался лишь он.
Я неточно выразился. Левитт не просто видит задачу там, где все видят данность — он видит, что ее решение далеко не очевидно. И не всегда удобно для общества. Что причина спада подростковой преступности в США — не рост экономики и культуры, а легализация абортов (если без обиняков, большинство потенциальных преступников убивают еще до появления на свет). Что порой выгоднее халтурить, получая мало и часто, чем работать на совесть и задорого. Что сделанное родителями до рождения ребенка влияет на его будущее даже больше, чем воспитание, а бассейн во дворе значительно опасней ружья в шкафу. Что богачи более склонны к мелким кражам, чем люди среднего достатка.
В общем, не случайно в первой же главе он предупреждает: экономика имеет мало общего с моралью.
Козьма Прутков
Рассказ о прогремевшей на весь мир книге — такой как "Фрикономика" — положено начинать с перечисления регалий. Бестселлер «Амазона», прекрасные отзывы в прессе, автор — профессор, лауреат…
Почему такой аннотации не хватит, чтобы вы сочли эту книгу достойной своего внимания?
Все мы знаем, чего стоят эти оценки и премии. Порой они заслужены «без дураков» — но зачастую все плюшки достаются произведению, которое не представляет из себя ничего выдающегося, а всего лишь оказалось в нужное время в нужном месте. Вспомним нашумевший опус про «афедрон»: как вышло, что объективно некачественный роман получил значительную литературную премию? И только ли в литературе нужно искать корни этого явления?
Стивен Левитт, автор «Фрикономики», прославился открытиями таких неочевидных причин. Он перелопачивает груды статистических данных, опрашивает людей; словно Шерлок Холмс, анализирует, сопоставляет — и выдает блестящее решение задачи, о самом существовании которой догадался лишь он.
Я неточно выразился. Левитт не просто видит задачу там, где все видят данность — он видит, что ее решение далеко не очевидно. И не всегда удобно для общества. Что причина спада подростковой преступности в США — не рост экономики и культуры, а легализация абортов (если без обиняков, большинство потенциальных преступников убивают еще до появления на свет). Что порой выгоднее халтурить, получая мало и часто, чем работать на совесть и задорого. Что сделанное родителями до рождения ребенка влияет на его будущее даже больше, чем воспитание, а бассейн во дворе значительно опасней ружья в шкафу. Что богачи более склонны к мелким кражам, чем люди среднего достатка.
В общем, не случайно в первой же главе он предупреждает: экономика имеет мало общего с моралью.
13.01.2011 22:36+0300
Подсознание →
Почему я не люблю перевод
Когда я только начинал читать книги о программировании, я читал их на русском, но, разочаровавшись в качестве перевода, я перешёл на оригинальный язык — английский. Почему? Если бы дело было только в орфографических ошибках… с этим я могу смириться. Для меня главная проблема — коверкание смысла оригинала.
Переводчиков учат, что необязательно переводить слово в слово, достаточно передавать смысл. Об этом меня известила учащаяся на лингвиста-переводчика жена, после того, как я излил ей свою душу о качестве перевода. Видимо, переводчики достаточно хорошо усвоили то, что слово в слово переводить не нужно, но то, что нужно ещё передавать и смысл…
Переводчиков учат, что необязательно переводить слово в слово, достаточно передавать смысл. Об этом меня известила учащаяся на лингвиста-переводчика жена, после того, как я излил ей свою душу о качестве перевода. Видимо, переводчики достаточно хорошо усвоили то, что слово в слово переводить не нужно, но то, что нужно ещё передавать и смысл…
27.01.2009 09:46+0300