Программа не нуждается в инсталляции и работает в той папке, в которую вы ее поместите




НазваниеПрограмма не нуждается в инсталляции и работает в той папке, в которую вы ее поместите
страница5/8
Дата конвертации14.12.2013
Размер1.1 Mb.
ТипПрограмма
1   2   3   4   5   6   7   8

эксперименты во время отладки показали неплохие

результаты по вытягиванию текста из фона

при разнице в их цвете всего лишь в 3-4%.

Вот это я сделал независимым для левой и правой половинок

разворота.

ОК. Сегодня постараюсь сделать Convert Threshold разными

(если получится втиснуть).

Чего еще сделал - чистка и возможность сохранения исходного

файла, корректировка dpi файлов (т.е. просто замена dpi в тифах

на нужное значение, т.к. недавно столкнулся с тифами, в которых

dpi было явно неправильным. Долго промучился, пока не понял, в чем дело).

Кстати, если кромсатор показывает что dpi=96 или 72, то с

вероятностью 90% это говорит о том, что файл вообще

не содержит инфу о dpi, и тогда кромсатор берет разрешение экрана.
-------------------------
Во время ручной расстановки резаков (особенно правого/левого), каждый

раз приходится тянуть их поочередно, тогда как ширина текста, как

правило, постоянна и удобнее было бы, если бы они тянулись "в связке",

т.е. как бы перемещалось "окно захвата". Можно, например, посадить это

дело на сочетание левокнопа с пробелом или левым альтом. А то и (типун

мне на язык) потеснить на правой кнопке наклонные резаки.
Это уже есть. Для синхронного сдвига нужно держать Ctrl

нажатой. Правда, при этом проявляется один глюк - на картинке

появляются черные полосы и пропадают после последующего щелчка

на картинке. Глюк появился в 3-й версии, до сих пор не могу понять,

откуда это вылазит. Где-то пере-оптимизировал...

----------------------------

А сейчас?

(http://bolega.hotmail.ru/Ver3.5/)

Для работы с DJVU нужно в sk.ini в секцию [Options]

прописать путь к djvudecode.exe, например

[Options]

DJVUDecode=c:\program files\_Utilities\djvu-decode\DjVuDecode.exe

Как всегда, все новое спрятано в контекстных менюшках.

Старался учесть многие пожелания.

Теперь работает объединение двух половинок страницы в одну

(при этом необязательно, чтобы в оригинале они располагались на

одном развороте, листы набираются по мере прохода).

Всякие хоткеи расписываю в новой доке. Так же как и работу с контрастом.

Без доки и примеров будет ничего не понятно.

Успехов!

------------------------------
я федорюка делал с ксерокса на нем много мусора (его ничем не уберешь

такой уж ксерокс) так что фича с авто чисткой мне весьма и весьма к

месту пришлась хоть часть почищу

Идею подал мне один из форумчан. К сожалению, кто именно, запяматовал.

Забыл сказать: чтобы открыть в view result выходные файлы задания,

сделанные в предыдущих сеансах, нужно при щелчке на меню "View result"

держать нажатым Ctrl. Правильность показа гарантируется если с момента

обработки из задания не удалялись файлы, и не снимались галки (т.е.

выходная нумерация файлов не изменилась)

--------------------------------
Проблемка есть очень часто нарываюсь если на стр есть одна выступающая

строка либо внизу (вверху) короткая строка например номер авторского

листа в книгах как бы даже на полях, то при автомаржинс нещадно

режется а если авто снять размер может не совпадать с другими стр

Это часто бывает. Ужесточить в данном случае определитель краев нельзя

- начнет за всякий мусор цепляться и считать его началом текста.

Лечится так: авто снимать ни в коем случае не надо, подвести резак как

можно вплотную к тому, что нещадно отрезается (номеру страницы

например) и если этот номер и, соответственно, резак находятся

например, слева, то убрать первую галку после слова Automargins в

опциях.

(Всего там четыре таких чек-бокса с галками -для левого, двух

внутренних и правого краев страницы соответственно). Снятие галки с

чек-бокса (при оставлении ее перед самой опцией Automargins)

трактуется кромсатором так: раз галки нет, но Automargins включен,

значит текущее положение соответствующего резака указывает на

положение начала текста страницы и мне (кромсатору то бишь) не нужно

его искать - юзер задал его вручную. Кромсатор сделает только одно -

прибавит к текущему положению резака Gap пикселей и в итоге получит

уже край листа книги. В итоге и ширина листа будет правильной, и текст

не срежется. В случае, если ручное задание проводится для правого или

нижнего краев, возможно, лучше будет еще задать и выравнивание равным

R или B соответственно.

-----------------------------
Из нового: на выходе теперь можно получать файлы с разными dpi и

color. Кое-какие параметры также можно задавать индивидуалными для

разных страниц (например, Dpi,despeckle,ручное задание угла deskew, и

т.д.). С помощью Ruler можно мерить не только расстояния, но и

одновременно угол наклона.

На изображениях можно задавать exclude-зоны, т.е. прямоугольные

участки, к которым не будет применяться despeckle (полезно для

изображений, из-за despeckle они могут сильно портиться) и которые не

будут участвовать в определении skew-угла (именно изображения приводят

к неправильной детекции угла наклона). Размерность полей и размеров

страниц теперь можно указывать как в пикселях, так и в 10*мм

(последнее особенно необходимо, если на выходе получаются файлы с

разными dpi).

-----------------------------
Ситуация действительно непростая.

Я сделал так:

1. Стал на 1-ю страницу. В draft выставил:

Kromsate = From current alternate

Cutting lines = Left, Top, Bottom (т.е. справа не кромсаю - чтоб не резался

жиденький текст)

Pre-cut marging = Left; 1/10 (этот параметр позволяет избавиться от

куска четной страницы, 1/xx - это примерный размер куска в долях

ширины страницы, значение xx можно узнать с помощью контекстного

меню ползунка резака "metric". Задавать значение xx точным

необходимости нет - лучше недорезать, чем отрезать лишнее. Для данной

книги я навскидку оценил среднее xx=8, для перестраховки задал

меньше - 1/10).

Запустил.

2. Стал на 2-ю страницу. В draft выставил:

Kromsate = From current alternate

Cutting lines = Right, Top, Bottom (т.е. слева не кромсаю, но в начале книги

слева имеется полоса. См. далее)

Pre-cut marging = Right; 1/10

Тут можно сразу бы выставить левый резак на 120 пикселей и в Draft

дополнительно задать Pre-crop using = Left, но обнаружился баг -

pre-crop не взялся из-за того, что в Cutting lines не был задан Left.

Поэтому уже после окончания draft выставил левый резак на 120 пикселей

от левого края, и в контекстном меню ползунка левого резака выбрал

команду "Copy current position to -> alternate down".

На весь draft у меня ушло в общей сложности 3 минуты.

------------------------------------

Вопрос всем: а как в кромсаторе убрать чёрные полосы и белый шум?

Только ли методом обрезки в первом случае?

А чем не подходит обрезка?

Можно еще опцией "Clear shadow". Если имеется разворот - cs убирает полосы

внутри разворота, если одиночная страница - опция считается относящейся к

ее краям.

Изначально предназначена для удаления полос, сливающихся с

текстом. Если же полоса хорошо изолирована от текста, можно дополнительно

повысить значение парметра AntishadowThreshold до максимума, т.к. по

умолчанию параметр обеспечивает аккуратное удаление сливающейся

с текстом полосы. Если же слития нет, то аккуратность уже не нужна.

Но это все для b/w-изображений.

Для gray можно использовать background cleaner (методы Vertical или

Horizontal; 2D - полосы не трогает). Есть правда побочный эффект - может

удалять и полезные вещи, например, вертикальные или горизонтальные

линии.

В draft-kromsate заложен более продвинутый алгоритм детекции полос.

Но он применяется только в draft.

А вообще интересно, для чего это надо?
------------------------------
Чтобы поменять настройку скопом, нужно держать нажатым Ctrl.

Например Ctrl+щелчок на automargin сносит опцию со всех marked-файлов.

Если же держать Shift, то настройка меняется у всех selected файлов (выделенных

красным цветом).

Но. Опция automargin имеет одну особенность - если она включена, то выключение

какой-либо из ее под-опций (например, T = top) означает только то, что

кромсатор не будет искать верхнюю границу начала текста страницы, а будет

предполагать, что она определена вами вручную, то есть где поставили резак -

значит вы и указали top. Прибавит к этому положению v.gap и получит

в итоге край листа. Поэтому, если требуется именно в принципе отменить

определение верха страницы, то для этого помимо отключения опции Top

нужно будет отключить и расстановку резаков и возможно занулить v.gap.

Отключение резаков скопом я не предусматривал (чревато). Но выход есть -

нужно вывести резаки за пределы картинки.

Итак, последовательность такая:

1) Ctrl+отщелкиваем (T) Top

2) Ctrl+отщелкиваем (B) Bottom

3) v.gap=0

4) становимся на любой файл и ставим top-резак в координату y=0 (или даже <0).

В контекстном меню top-ползунка выбираем команду Copy current position to all marked.

5) ставим bottom-резак в координату y=конец картинки или даже лучше пониже ее.

В контекстном меню bottom-ползунка выбираем команду Copy current position to all marked.

В итоге на выходе высота всех файлов останется неизменной и равной высоте

исходных изображений (разница может все-таки быть из-за компенсации deskew).
--------------------------------
Понимает.

Только надо ручками в sk.ini в секцию [Options] прописать путь к

DjVuDecode.exe.

Например:

DJVUDecode=c:\program files\djvudecode\DjVuDecode.exe

Сам DjVuDecode.exe можно взять например в Колхозе.

После этого раздизейблится пункт контекстного меню списка файлов

"Special. Open DJVU"
----------------------------------
параметры сильно зависят от сканов. выше я привел значения для книги

токамаки.

Еще влияет convert threshold, если он высокий, то контраст можно

делать поменьше, и наоборот. Кол-во проходов клинера как правило

хватает одного. В редких случаях повторные проходы слегка улучшали.

Это можно легко проверить: выставить выходной формат как original

(чтобы не конвертилось в b/w), либо в последней версии можно просто

поставить галку на "don't change out color" (это повлияет только на

preview - и не надо переключать тогда все время Out color), задать

cleaner passes = 1, нажать preview. Картинка очистится, но останется

Gray. Снова нажать preview - т.е. сделать еще один проход для

_текущей_ видимой картинки (preview выполняется не для оригинала, а

для отображаемого в данный момент). Если визуально видно, что ничего

не поменялось, значит проход уже излишен. Если же одновременно задано

изменение контраста, то подряд нажимать preview будет уже не

корректным - получится такая последовательность: clean,contrast +

clean,contrast вместо clean,clean,contrast (именно так будет при

настоящей обработке). Поэтому после каждого preview нужно делать Undo

и увеличивать clean passes.

Correct low contrast используется тогда, когда интенсивность текста и

фона почти равны (буквы еле различимы на фоне тени). если оставить

только клинер, то он вместе с фоном почистит и текст. Изменение

контрастом тоже не особо выручит - тень тоже на столько же потемнеет.

Если же включен CLC, то при удалении фона кромсатор будет

анализировать цвет фона и цвет малой окрестности точки. Если их

разница будет больше Sensitivity (=5..25), то он эту точку чистить не

будет (при отключенном increase black) либо даже сделает полностью

черной (при включенном increase black - по умолчанию), а окрестность

почистит. Мусор немножко конечно останется, но буквы уже можно будет

свободно читать. Здесь все будет зависеть от подбора значения

Sensitivity.

Есть еще опция protect black pixels. Она нужна вот когда: клинер может

начисто зачистить черные области, которые таковыми и являются на самом

деле (побочный эффект). При включенной же опции он не будет чистить

очень темные точки.

Есть еще опция ignore light pixels. Когда CLC не дает клинеру чистить

текст, то из-за того, что Sensitivity является относительным

значением, то "спасаться" будут все пиксели, чьи соседи имеют с ними

разницу в цвете равной Sensitivity. В итоге почернеют не только буквы,

но и сам фон. Поэтому ignore light pixels гарантирует, что вытягивание

контраста будет применяться только к тексту, а не к неравномерностям

фона. Но я оставил возможность отключать эту фичу. Вот из-за чего: у

меня был чистый скан, но часть текста была отпечатана не черным, а

синим и желтым цветом. такой текст в скане стал очень бледным. Простое

повышение контраста для всей картинки спасало, но сильно ужирняло

нормальный черный текст. Поэтому я использовал здесь CLC, который

действует избирательно. В итоге простой текст не менялся, а бледный

улучшался. Хотя контраст улучшал все-таки лучше. (В новой версии я

сделаю улучшение контраста в выделении по типу autoclear).
----------------------------------
Нельзя ли сделать, чтобы режим/окно "Result view" можно было

открывать, без предворительного кромсания, для всех страниц. Часто в

"Result view" я подчищаю страницы в ручную, но дело это долгое. Если

закрыть кромсатор и вернуться к работе позднее, то надо кромсать

снова. Или я там чего-то не досмотрел?

Можно. Для этого при выборе пункта меню "View result" нужно держать

нажатым Ctrl. При этом кромсатор определит (и запомнит) имена выходных

файлов, не выполняя самого кромсания. Это достаточно сделать один раз.

Кстати, в новой версии это делается автоматически при загрузке

задания. Но как я уже говорил, новая версия будет только после

праздников.
-------------------------------------
Я в этом случае делаю так. Если art-deskew не включен для такой

страницы, я его включаю. И наоборот. Как правило, всегда помогает.

Один из двух методов, да сработает.

Вообще я остановился на такой методике. Кромсаю всегда в один проход.

Задаю опцию "use average width". В этом случае неправильно повернутые

страницы не оказывают влияния на ширину/высоту выходных файлов. Если

все нормально (в смысле размеров), переключаю width type и height type

на fixed (значение этих самых fixed кромсатор сам подставляет после

полного кромсания). Прохожусь по результату, если что-то не

устраивает, корректирую опции для этой страницы. Можно тут же ее

перобработать, выбрав "process current", либо просто мечу ее

selection-ом. Поскольку задан теперь fixed размеры, то можно спокойно

обрабатывать по одной странице, не беспокоясь, что размеры будут

разными. Если использую пометки, то после того, как все нужные

пометил, выбираю "process selected". В новой версии есть еще режим

автоматического select тех страниц, для которых поменялись опции. Еще

один недокументированный мною раньше нюанс: чтобы пометить в списке

файл, находясь при этом в окне просмотра результата, нужно нажать F2

или F2 и F3 (для левого и правого файла, в случае, если в окне

просматриваются сразу два выходных файла). И еще. Как правило,

неверный поворот происходит из-за иллюстраций или мелко-зернистых или

градиентных областей. Начиная с версии 4.0 можно применять

exclude-зоны. Я заключаю такие участки в exclude-зону (допускается до

20 зон на страницу). Помогает на 100%. Дело в том, что такие зоны

кромсатор исключает при deskew и despeckle. В итоге и угол

определяется правильно, и despeckle не портит иллюстрации. В новой

версии еще добавилось поддержка bitonal-конвертирования зон. Просто

спасение для точной передачи многотоновых иллюстраций.
------------------------------------
Не совсем так. Число он подбирает при page=auto. А при fixed он это

число (т.е. размеры страницы) выдерживать будет для всех листов книги.

Т.е. сначала я кромсаю при auto, получаю в итоге нужные размеры, потом

переключаюсь на fixed и дорабатываю отдельные страницы не заботясь уже

об их размерах. Причем часто я кромсаю при auto страниц 10-20, получаю

от кромсатора fixed-размеры, переключаюсь на режим page=fixed и

кромсаю уже всю книгу.

Насчет второго прохода. тут все зависит что делать при первом, а что

во втором проходе. Например, deskew лучше делать при первом, когда

страница еще в gray (понятно что gray будет поворачиваться с лучшим

качеством). При наличии целой группы преобразований (напр.,

конвертация цвета, dpi, enhance, deskew и т.д.) Кромсатор оптимизирует

последовательность выполнения этих операций с точки зрения качества.

Если например имеется gary->bw, то сначала выполнится deskew и только

потом поменяется цвет. Если dpi меняется из 600 на 300, то deskew

также выполнится первым, а если 300->600, то наоборот.
--------------------------------------
150->300 это и есть upsample.

Нюанс тут один - какой фильтр выбрать. Наилучшее качество получится

при Bicubic (Options.ResampleFilter) Если вы имели ввиду как

вытягивать текст, плохо различимый на фоне, то так: В Quality включить

Enhance image. Нажать Gray enhance. На закладке Background cleaner

подбирать параметры. cleaner passes=1, correct low contrast=On. Потом

играться значением sensitivity (от 10 до 30 c шагом 5). Не сохраняя

(применяя) опции, можно сразу же нажимать Preview (или Preview with

resample если увеливается dpi) и смотреть результат. Если текст

сливается с фоном, и при этом сам скан бледноват, то дополнительно

увеличить слегка контраст (там же, на закладке Contrast), единиц этак

8-15, не больше. Для примера, для файла 18 книги Дынкина (стр.34-35) я

подобрал так: контраст=+9, sensitivity=25, для файла 17 контраст=+18,

sensitivity=10, для файла 16 контраст=+9, sensitivity=35. Как видите

все индивидуально. Но все просто просто. Если текст бледноват, ставлю

контраст примерно 15-20. Потом подбираю sensitivity. Если текст виден

хорошо, то ставлю контраст 9-10, подбираю sensitivity. На самом деле

тут есть взаимосвязь, и с опытом начинаешь быстро на глаз определять,

что ставить.
-------------------------------------
Три режима расчета страниц:

- Auto

- Fixed (тут понятно, будет выдерживать заданные размеры)

- None (обрежет резаками и оставит то, что осталось)

При Auto два способа: если включена опция Use average width/height, то

после обрезания, определения контуров страниц (т.е. по самым краям

текста со всех сторон) и прибавления к ним полей (gaps) высчитывается

средняя ширина/высота. Затем, все страницы, меньшие средней,

отбрасываются. За счет этого избавляемся от мало-заполненных страниц.

Снова считается среднее. Это и будет окончательный размер. Если

какая-то страница черезчур широка (бывает в книгах такое - иллюстрации

или таблицы вылазят на поля), то в итоге она может подрезаться. Но как

правило, это можно компенсировать изменением полей. Для этого, если,

например, режется сбоку, поставьте гориз.выравнивание для нее

по-центру, и все будет нормально - поля с обоих сторон уменьшатся и

она влезет.

Если режим Use average выключен, то окончательная ширина/высота будет

уже определяться максим.значениями. При этом проводится также

простенький стат.анализ: если максим. размер черезчур отличается от

среднего (которое также считается два раза, 2-й раз - после

отбрасывания мелкоразмерных), то предполагается, что это обусловлено

вышеупомянутыми черезчур широкими страницами, и размер уменьшается, а

для этих упомянутых страниц поля также уменьшаются, но не более, чем

на 1,5 gap. Как правильно заметил kvk, большинство проблем с обрезкой

можно предотвратить, выбрав подходящий gap. Для 600 dpi я использую

150 на 180, для 300 dpi - 80 на 100. Т.е. нормальные поля компенсируют

погрешности оконтуривания.

А проблемы бывают. Это из-за того, что определитель контура работает с

определенной заложенной в него погрешностью, чтобы ложно не

спотыкаться на мусоре. Кроме того, контурный анализ проводится не

по-строчно, а по 4-8 строк/столбцов (в зависимости от dpi) за раз (для

убыстрения, да и со статистич. точки зрения более достоверно). Поэтому

например, может не включить в контур номер страницы(особенно в начале

книги, когда номер из одной цифры). Компенсируется это либо

достаточным значением gap, либо ручным заданием резака: поставили

резак вплотную к настоящему краю (напр, снизу) и убрали

соответствующую галку в под-галках Automargins. Т.е. как бы вручную

задали положение нижнего контура для данной страницы. Есть и третий

способ: если страница режется слева, просто поставьте для нее

выравнивание Right или Center. Помогает хорошо. В новой версии можно

указать режим None для отдельной страницы. Это бывает нужно например

для обложки - она практически всегда больше чем все остальные

страницы. В этом случае ее размер будет определяться исключительно

резаками, gap-ы игнорируются, и в расчете окончательных размеров она

также не участвует.


1) Золотое свойство Кромсатора - Draft Kromsate (right mouse button в

списке файлов) - предварительно расставляет резаки для отделения ненужных

краев и черной полосе в середине разворота (!!!! супер !!!!)

=================================


Автор: bolega, Отправлено:17:46 22-06-2004
max67
Цитата:Напомните, пожалуйста, еще раз эту процедуру. (Извиняюсь за

склероз.)

Например, есть 8-bit скан в 150 dpi. В кромсаторе я просто

устанавливаю на выходе b/w 300 dpi. Результат в принципе получается

неплохой. Но может есть ещё какие-то нюансы? Помнится прделагалось

делать предварительный upsample.
150->300 это и есть upsample.

Нюанс тут один - какой фильтр выбрать. Наилучшее качество получится

при Bicubic (Options.ResampleFilter)

Если вы имели ввиду как вытягивать текст, плохо различимый на фоне, то

так:

В Quality включить Enhance image. Нажать Gray enhance. На закладке

Background cleaner

подбирать параметры. cleaner passes=1, correct low contrast=On. Потом

играться значением sensitivity (от 10 до 30 c шагом 5). Не сохраняя

(применяя) опции, можно сразу же нажимать Preview (или Preview with

resample если увеливается dpi) и смотреть результат. Если текст сливается

с фоном, и при этом сам скан бледноват, то дополнительно увеличить слегка

контраст (там же, на закладке Contrast), единиц этак 8-15, не больше.

Для примера, для файла 18 книги Дынкина (стр.34-35) я подобрал так:

контраст=+9, sensitivity=25, для файла 17 контраст=+18, sensitivity=10,

для файла 16 контраст=+9, sensitivity=35. Как видите все индивидуально. Но

все просто просто. Если текст бледноват, ставлю контраст примерно 15-20.

Потом подбираю sensitivity. Если текст виден хорошо, то ставлю контраст

9-10, подбираю sensitivity. На самом деле тут есть взаимосвязь, и с опытом

начинаешь быстро на глаз определять, что ставить.
Автор: bolega, Отправлено:18:09 05-07-2004
XW
Цитата:проблема в том , что 2D images могут существовать только в

грейскеле
Не совсем так. Если применить half-toning (иногда называют и как bitonal),

то картинки будут вполне приемлимого качества при условии. что они в

600dpi. При 300dpi half-toning дает плохие результаты. Где-то упоминалось

то ли о плагине к pshop то ли отдельная тулза, кот. может классно

конвертить в half-toning путем подбора b/w точек разного размера и формы,

т.е. адаптивно. Вот только не помню, адаптивность эта автоматическая или

ручками подбирать. И название тулзы забыл Тогда не надо было, а сейчас бы

пригодилась,т.к. сам над этим бьюсь.

Кстати и некоторые продвинутые сканеры имеют помимо b/w и gray еще режим и

bitonal - специально для b/w-сканирования иллюстраций.

Автор: bolega, Отправлено:16:38 08-07-2004
xogok
Цитата:Филлипса в разрешении, соответствующем, по-видимому, 300 dpi

в grayscale. Получилось отстойно (после конвертации в bw),
Для серых на глаз довольно трудно определить реальный dpi.

Лучше замерить точно. Это важно.

Как уже не раз говорилось, простая конвертация в b/w по порогу для dpi<600

дает плохой результат. Другие методы конвертации опять же не подходят,

т.к. скан с фоном, а эти самые методы его не чистят, и получается ужасная

грязь. Надо обязательно одновременно с конвертацией поднимать в 2 раза

dpi. Ну и если фон неравномерный, то нужно его предварительно убирать.
Автор: bolega, Отправлено:18:36 08-07-2004
xogok
Цитата:Выложил в свою папку xogok-Macmep результат обработки и

оригинальную страницу:

Lax_example.tif

и

Lax_example.jpg

соответственно. Научите бороться с фоном -- это и для Ростовцева (по

криптографии) важно! В Кромсаторе.

В свою очередь положил в свою папку ту же страницу обработанную

кромсатором

0001.tif

По-моему, это получше.

Сделано так:

Background cleaner passes = 1

Correct low contrast = On (!!!)

Sensitivity = 25

increase black = Off (!!!)

Convert to b/w threshold = Normal

все остальное по умолчанию.
Добавлено

Да, забыл: dpi исх.файлов задано вручную на закладке Files (Input dpi =

300),

output dpi = twice greater.

Файл действительно примерно 300dpi, может чуть больше (легко проверяется в

кромсаторе с помощью Ruler).

Для серых такой dpi - это замечательно.
Добавлено

Задавать правильный dpi - это для кромсатора очень существенно, т.к.

многие внутренние параметры подбираются исходя из dpi. особенно при

despeckle и draft kromsate.
Автор: bolega, Отправлено:19:24 08-07-2004
Напомню, что в кромсаторе убирание фона оптимизировано для неравномерных

фонов.
Автор: bolega, Отправлено:21:48 08-07-2004
XW

Пристрелянный у вас, однако, глаз

Автор: stilinor, Отправлено:22:16 08-07-2004
.../stilinor/Nikylin A.V., Kykysh A.G, Tatarenko U.S - Planimetrijh.

Geometrijh na Ploskosti(Alpha,1997)(ru)(K)(588s)-600DPI,lossless.djvu
Планиметрия. Геометрия на плоскости: Учебное пособие

ISBN: 9986-582-54-7
В последнее время я пришёл к заключению что сканирование в 600 dpi

несравненно менее продуктивно чем сканирование в 300 dpi, и дело не только
в том что на скан уходит почти в три раза больше времени (скан в 300 dpi -
15-16 сек., в 600 dpi - 42-43 сек. (и то и другое с возвратом)), но и в

том

что 15 сек. нетрудно прижимать книгу к сканеру, а когда это время

возрастает

до 42 сек. - нужно уже прижимать книгу каким-то грузом, что берёт ещё

какое-то время, а если ещё и заниматься чем то пока страница сканируется

(ведь не смотреть же в потолок почти целую минуту), то вообще выходит

не больше разворота в 5 минут - иначе если отвлекаться каждую минуту,

невозможно сосредоточится . А так, спокойно получаются минимум три

разворота за минуту, да и качество более не менее сносное (по крайней мере
если делать в lossless), и не трудно выделить 30 мин. в день эксклюзивно

для сканирования.

К тому же, возможно что высокое разрешение способствует более быстрому

снашиванию сканера - при 300 dpi делается один безостановочный проход,

а для 600 dpi - 7 остановок в середине.
Ну вот, теперь надеюсь что больше не буду страдать от излишних мучений

совести

из за того что решил переходить на 300 dpi .
Автор: bolega, Отправлено:19:52 14-07-2004
xogok

Насчет чистки.

Чтобы в старой версии (4.0Pre) открыть out-файлы и продолжать их чистить,

нужно после открытия пакета с заданием нажать в меню "View Result", держа

при этом нажатым Ctrl. (В готовящейся версии это делается автоматом).

В новой версии чистить можно прямо исходники.

В старой версии тоже можно, но кромсатор не всегда напоминает, что нужно

сохранить.

Кстати, чувствую, что новую версию кромсатора мне еще делать и делать

(слишком на многое замахнулся, да все так увязано), поэтому, думаю, может

кто возьмется пока за бэта-тестирование. А то конца-края не видно.

bolega, Отправлено:11:39 26-07-2004
Level42
Цитата:Не заметил большой разницы после прохода кромсатором. Не могу даже утверждать, что кромсатор "утолщает" или "сглаживает" форму букв. При большом разрешении видно, что иногда он обрасывает ненужные пикселы, иногда добавляет (иногда лишние).

В действительности кромсатор сглаживает форму букв. Но для этого надо включить опцию Enhance.Smooth и задать кол-во проходов (1-3). Кроме этого, всякие лохматости неплохо убираются despeckl-ом, но как я увидел на этих сканах, для этого нужен не один проход despeckle, как сейчас, а несколько. В существующей версии кромсатора этого не предусмотрено. В новой версии это есть, но уже в окне ViewResult.

Как Вы правильно заметили, все эти операции носят статистический характер. А иначе как вы определите, не задействуя OCR, какие закорючки - хлам, а какие - часть букв или тем более иллюстраций. Поэтому ожидать даже после smooth идеальной формы букв не приходиться. Тем более, что многие буквы из упомянутых сканов - песочно-образные, состоят из разрозренных точек. Поэтому опция sand despeckle (которая хоть как-то соединит точки букв) здесь не помешает.

OCR не входит в мои планы. Единственное исключение, которое я сделал в новой версии - это примитивный OCR букв i и j, которые используются как индексы в формулах, суммах и т.д. Так как в новой версии новый, более "чистящий" алгоритм удаления изолированных спеклов, то мне пришлось вводить ocr для этих букв, чтобы избежать потери точечек в этих глифах.

И еще. Все сканы разные, качество меняется не только от книге к книге, но и от страницы к странице. Это я к тому, что многие полезные вещи можно было реализовать в кромсаторе, но тогда из-за упомянутого разнобоя в качестве сканов пришлось бы предоставлять пользователю множество параметров, которые, побобранные и хорошо работающие на одном скане, на другом бы не дали ничего. Это я к тому, что превращать кромсатор в графич. редактор с десятками вручную подбираемыми параметрами я не хочу - по большому счету этим подбором никто заниматься не будет. Все хотят, чтобы нажал кнопку - и получил результат. Кромсатор - это в первую очередб для пакетной обработки с минимальными усредненными настройками. А иначе какой смысл в изобретении нового фотошопа.
P.S. Свой "замечательный", как выразился tefeka, кромсатор я никому не навязываю.

Level42, Отправлено:12:17 26-07-2004
bolega

Спасибо за разъяснения.

Enhance.Smooth у меня, конечно, выключено по причине неумения обращаться.

Despeckle, наоборот, включено всегда. Однако, видимо, одного прохода действительно

маловато. Despeckle в окне ViewResult, когда можно сразу посмотреть, что же

получается в результате (если я Вас правильно понял) должно быть очень полезным.

Остается только мечтать о возможности применить despeckle не ко всему тифу, а к

выделенному участку, поскольку как Вы заметили, текст даже на одной странице

частенько бывает неоднородным.

Вы, наверняка, получаете массу писем с восторгами и благодарностями от счастливых

пользователей, как правило, заканчивающиеся пожеланиями и советами, как и что,

по их мнению, надо бы улучшить. Ведете ли Вы что-то вроде proposed enhancements list,

где были бы отражены Ваши дальнейшие планы по разработке? Лишние хлопоты,

понятно, но всё же?


bolega, Отправлено:13:15 27-07-2004
HumptyDumpty

Почти на все kvk ответил. Спасибо.

Три режима расчета страниц:

- Auto

- Fixed (тут понятно, будет выдерживать заданные размеры)

- None (обрежет резаками и оставит то, что осталось)

При Auto два способа: если включена опция Use average width/height, то после обрезания, определения контуров страниц (т.е. по самым краям текста со всех сторон) и прибавления к ним полей (gaps) высчитывается средняя ширина/высота. Затем, все страницы, меньшие средней, отбрасываются. За счет этого избавляемся от мало-заполненных страниц. Снова считается среднее. Это и будет окончательный размер. Если какая-то страница черезчур широка (бывает в книгах такое - иллюстрации или таблицы вылазят на поля), то в итоге она может подрезаться. Но как правило, это можно компенсировать изменением полей. Для этого, если, например, режется сбоку, поставьте гориз.выравнивание для нее по-центру, и все будет нормально - поля с обоих сторон уменьшатся и она влезет.

Если режим Use average выключен, то окончательная ширина/высота будет уже определяться максим.значениями. При этом проводится также простенький стат.анализ:

если максим. размер черезчур отличается от среднего (которое также считается два раза, 2-й раз - после отбрасывания мелкоразмерных), то предполагается, что это обусловлено вышеупомянутыми черезчур широкими страницами, и размер уменьшается, а для этих упомянутых страниц поля также уменьшаются, но не более, чем на 1,5 gap.

Как правильно заметил kvk, большинство проблем с обрезкой можно предотвратить, выбрав подходящий gap. Для 600 dpi я использую 150 на 180, для 300 dpi - 80 на 100. Т.е. нормальные поля компенсируют погрешности оконтуривания.

А проблемы бывают. Это из-за того, что определитель контура работает с определенной заложенной в него погрешностью, чтобы ложно не спотыкаться на мусоре. Кроме того, контурный анализ проводится не по-строчно, а по 4-8 строк/столбцов (в зависимости от dpi) за раз (для убыстрения, да и со статистич. точки зрения более достоверно). Поэтому например, может не включить в контур номер страницы(особенно в начале книги, когда номер из одной цифры). Компенсируется это либо достаточным значением gap, либо ручным заданием резака: поставили резак вплотную к настоящему краю (напр, снизу) и убрали соответствующую галку в под-галках Automargins. Т.е. как бы вручную задали положение нижнего контура для данной страницы. Есть и третий способ: если страница режется слева, просто поставьте для нее выравнивание Right или Center. Помогает хорошо.

В новой версии можно указать режим None для отдельной страницы. Это бывает нужно например для обложки - она практически всегда больше чем все остальные страницы. В этом случае ее размер будет определяться исключительно резаками, gap-ы игнорируются, и в расчете окончательных размеров она также не участвует.
Цитата:Все в том-же режиме постобработки очень хочется иметь

bitmap-editor
Пока что сделал ластик, стирающий одним из трех цветов: белым, черным, или

средним по заданной области (это для цветных и серых). Всякие Copy/Paste

несомненно будут, но попозже. Так же как и поворот выделенной области.

Сейчас на страницу можно поместить штамп (с поддержкой прозрачности),

двигать его мышкой, изменять размеры, и затем слить с изображением.

Насчет hotkeys. Правда, совсем забыл про масштаб клавой. Счас сделаю

(+,-).

Автор: bolega, Отправлено:12:54 26-07-2004
kvk
Цитата:ждем хотя бы beta версии
Она уже готова. Думаю, через пару дней выложу, если ничего срочное не

отвлечет.
Цитата:Остается только мечтать о возможности применить despeckle не

ко всему тифу, а к

выделенному участку,
Именно так сейчас и работает в новой версии.

Причем имеется и white-despeckle, когда убираются не черные точки, а

наоборот - белые на черном фоне.
Level42
Цитата:Вы, наверняка, получаете массу писем с восторгами и

благодарностями от счастливых

пользователей, как правило, заканчивающиеся пожеланиями и советами,

как и что,

по их мнению, надо бы улучшить. Ведете ли Вы что-то вроде proposed

enhancements list,
Не переоценивайте кромсатор. Программа еще далека от совершенства. Поэтому

восторгов особых нет. А пожелания конечно-же учитываю. Приведу краткий

список "местных" завседатаев, которые мне очень помогли с советами и

пожеланиями (в хронологическом порядке): kvk, botolph, xodok и многие

другие. Спасибо!
Раз уж речь пошла о новой версии, скажу, что есть нового: режим

автопринятия изменений опций; резаки теперь синхронизируются с картинкой

при изменении масштаба, повороте и flip; новые форматы выходных файлов

(gif,pbm,pxm); много новых операций по манипулированию списком исходных

файлов, причем при манипулировании происходит автоматическое

переименовывание вых. файлов; сканировать и обрабатывать можно

одновременно; экспорт картинок из pdf (пока работает не очень хорошо,

поддержка JBIG2 только в стадии отладки), режим чистки ластиком (3 формы),

magic-wand, усреднение цвета и т.д.
bolega

Help, please! Помогите начинающему колхознику.
Пытаюсь пользоваться кромсатором, получаю массу удовольствия

от имеющихся возможностей. Но возникли две проблемы :
1. В режиме постобработки иногда хочется прерваться и продожить на

следующий день. А как после загрузки конфигурации продолжить

обработку уже нарезанных страниц - так или я не нашел, или просто не

задумано было...
2. Вторая проблема посерьезнее. Когда нарезаю страницы в режиме split

с автоматическими компенсацией наклона и автоопределением ширины, то

некоторые страницы чересчур чъезжают вправо или вниз, так, что теряется

1   2   3   4   5   6   7   8

Похожие:

Программа не нуждается в инсталляции и работает в той папке, в которую вы ее поместите iconПрограмма работает только на той платформе, под которую она скомпилирована
Интерпретация байткода на порядок (10-20 раз) медленнее исполнения аналогичного машинного кода. . 
Программа не нуждается в инсталляции и работает в той папке, в которую вы ее поместите iconPutty популярный Telnet и ssh-клиент, т е. программа для безопасного подключения к удаленному компьютеру (например, веб-серверу) и выполнения на нем различных
Работает без инсталляции, с домашней страницы можно скачать исходники, а также версию для unix
Программа не нуждается в инсталляции и работает в той папке, в которую вы ее поместите iconИнструкция по установке Для установки системы мистер необходимо выполнить
В процессе работы программы инсталляции потребуется выбрать режим инсталляции: Typical или Custom. В режиме Typical автоматически...
Программа не нуждается в инсталляции и работает в той папке, в которую вы ее поместите iconПрограмма бесплатная, работает в window и linux. Устанавливается легко, занимает мало места, без вебкамеры и микрофона работает в текстовом режиме. Войдя на

Программа не нуждается в инсталляции и работает в той папке, в которую вы ее поместите iconПрограмма бесплатная, работает в window и linux. Устанавливается легко, занимает мало места, без вебкамеры и микрофона работает в текстовом режиме. Войдя на

Программа не нуждается в инсталляции и работает в той папке, в которую вы ее поместите iconПрактическая работа №1
Создайте в своей рабочей папке (папке с вашей группой) следующие папки: папку со своей фамилией, в ней папки Архивы
Программа не нуждается в инсталляции и работает в той папке, в которую вы ее поместите icon7 Часто задаваемые вопросы  10 Revised: November 13, 2012
Голосовые сообщения появляются либо в папке входящих сообщений Outlook, либо в отдельной папке Outlook
Программа не нуждается в инсталляции и работает в той папке, в которую вы ее поместите iconПрактическая работа №1 «Архивирование файлов» Выполнив данную практическую работу, вы научитесь
Создайте в своей рабочей папке (папке с вашей группой) следующие папки: папку со своей фамилией, в ней папки Архивы
Программа не нуждается в инсталляции и работает в той папке, в которую вы ее поместите iconУроки модернизации России
Доклад этот - по преимущест ву моя личная позиция как ученого. Но в нем учтены ре зультаты той большой работы, которую вели и Вольное...
Программа не нуждается в инсталляции и работает в той папке, в которую вы ее поместите icon«О летающих медведях и невеждах, которые не знают, как  устроен этот мир, а если проще о воображении и  реальности»  
И хотя мы об этом и не упомянули, это в той же мере работает и в отношении наших страхов. Ведь 
Разместите кнопку на своём сайте:
kak.znate.ru


База данных защищена авторским правом ©kak.znate.ru 2012
обратиться к администрации
KakZnate
Главная страница