исследования

Распознавание регистрационных номеров с автомобилей с помощью MatLab

В описывается процесс распознавания автомобильных регистрационных номеров.

result

Это задание было дано на курсе «Введение в компьютерное зрение 2010» Лаборатории Компьютерной Графики и Мультимедиа ВМК МГУ.

Задание было поделено на три этапа:Читать дальше

  1. Распознавание основных 3 цифр номера с картинки, содержащей только номерной знак (ну и чутка области вокруг). Изображение не нормированы, номера находятся примерно горизонтально;
  2. Распознавание всех символов с номера (суть задания была в том, чтобы обучить и применить классификатор, сама реализация классификатора была нам дана);
  3. Распознавание номера из видео потока ( несколько секунд видео, содержащего одну проезжающую машину);

Нечёткий поиск в тексте и словаре

Алгоритмы нечеткого поиска (также известного как поиск по сходству или fuzzy string search) являются основой систем проверки орфографии и полноценных поисковых систем вроде Google или Yandex. Например, такие алгоритмы используются для функций наподобие «Возможно вы имели в виду …» в тех же поисковых системах.

В этой обзорной статье я рассмотрю следующие понятия, методы и алгоритмы:

  • Расстояние Левенштейна
  • Расстояние Дамерау-Левенштейна
  • Алгоритм Bitap с модификациями от Wu и Manber
  • Алгоритм расширения выборки
  • Метод N-грамм
  • Хеширование по сигнатуре
  • BK-деревья

А также проведу сравнительное тестирование качества и производительности алгоритмов.Читать дальше

Story URL: 

B-tree - деревья

Деревья представляют собой структуры данных, в которых реализованы операции над динамическими множествами. Из таких операций хотелось бы выделить — поиск элемента, поиск минимального (максимального) элемента, вставка, удаление, переход к родителю, переход к ребенку. Таким образом, дерево может использоваться и как обыкновенный словарь, и как очередь с приоритетами.

Основные операции в деревьях выполняются за время пропорциональное его высоте. Сбалансированные деревья минимизируют свою высоту (к примеру, высота бинарного сбалансированного дерева с n узлами равна log n). Большинство знакомо с такими сбалансированными деревьями, как «красно-черное дерево», «AVL-дерево», «Декартово дерево», поэтому не будем углубляться.

В чем же проблема этих стандартных деревьев поиска? Рассмотрим огромную базу данных, представленную в виде одного из упомянутых деревьев. Очевидно, что мы не можем хранить всё это дерево в оперативной памяти => в ней храним лишь часть информации, остальное же хранится на стороннем носителе (допустим, на жестком диске, скорость доступа к которому гораздо медленнее). Такие деревья как красно-черное или Декартово будут требовать от нас log n обращений к стороннему носителю. При больших n это очень много. Как раз эту проблему и призваны решить B-деревья!

B-деревья также представляют собой сбалансированные деревья, поэтому время выполнения стандартных операций в них пропорционально высоте. Но, в отличие от остальных деревьев, они созданы специально для эффективной работы с дисковой памятью (в предыдущем примере – сторонним носителем), а точнее — они минимизируют обращения типа ввода-вывода.Читать дальше

Story URL: 

Динамическое программирование. Классические задачи

Во многих олимпиадных задачах по программированию решение с помощью рекурсии или полного перебора требует выполнения очень большого числа операций. Попытка решить такие задачи, например, полным перебором, приводит к превышению времени выполнения.

Однако среди переборных и некоторых других задач можно выделить класс задач, обладающих одним хорошим свойством: имея решения некоторых подзадач (например, для меньшего числа n), можно практически без перебора найти решение исходной задачи.

Такие задачи решают методом динамического программирования, а под самим динамическим программированием понимают сведение задачи к подзадачам.Читать дальше

Story URL: 

Mathematica 5th ed by Stephen Wolfram

As both a highly readable tutorial and a definitive reference for over a million Mathematica users worldwide, this book covers every aspect of Mathematica. It is an essential resource for all users of Mathematica from beginners to experts. This expanded fifth edition presents Mathematica Version 5 for the first time and is important for anyone interested in the progress of advanced computing.

Обзор типов индексов Oracle, MySQL, PostgreSQL, MS SQL

В одном из комментариев здесь была просьба рассказать подробнее об индексах, и так как, в рунете практически нет сводных данных о поддерживаемых индексах различных СУБД, в данном обзоре я рассмотрю, какие типы индексов поддерживаются в наиболее популярных СУБД Читать дальше
Story URL: 

Options, Futures, and Other Derivatives (7th Edition). Hull, J

This book can be used for a first course in derivatives or for a more advanced course.

RSS-материал