OberonCore
https://forum.oberoncore.ru/

Парсер Html кода
https://forum.oberoncore.ru/viewtopic.php?f=35&t=4433
Страница 1 из 1

Автор:  bill [ Четверг, 15 Август, 2013 18:36 ]
Заголовок сообщения:  Парсер Html кода

Продолжение темы браузера тока это отдельная подтема, вот моя точка зрения http://zx.oberon2.ru/forum/viewtopic.php?f=48&t=132
, ... А сейчас по теме: Это идея пока еше не реализована , вот алгоритм будуюшего html парсера.

1. Весь тескт Html присвоить к строковой переменной
2. Найти "<html>" и "</html>"
3. Удалить эти теги
4. Остался остальной текст без этих тегов
5. Присвоить остаток к строковой переменной "уровень 2"
6. Найти "<head>" и "<\head>"
7. Удалить эти теги
8.Остался остальной текст без этих тегов
9. Присвоить остаток к строковой переменной "уровень 3"

Ну как вам мояя идея ? Читая значения которые скрыты в Html , можна начать визуализацию, Тока пока для самых простых Html кодов без наваротов

Автор:  Илья Ермаков [ Четверг, 15 Август, 2013 19:30 ]
Заголовок сообщения:  Re: Парсер Html кода

Батенька, Вам нужно непременно изучить методы синт. разбора.
Непременно!
Например, по Вирту "Построение компиляторов":
http://www.ozon.ru/context/detail/id/19133384/

Потому что Вы сейчас пытаетесь, уж извините, решить задачу "с помощью лома и какой-то матери" :)

Потом можно попробовать построить парсер для корректного XHTML (HTML, который является одновременно правильным XML). И только потом уже...
Но вообще, разбор любого невалидного HTML и построение нормального DOM - это неподъёмная задача для одного человека, не работающего полный рабочий день над этим за зарплату ))
Если хочется поупражняться, то можно и остановиться на уровне разбора XML...
Или таки сконцентрироваться и довести до "выхода" пару-тройку проектиков поменьше (но не пытаться все сразу!!).

Успехов!

Страница 1 из 1 Часовой пояс: UTC + 3 часа
Powered by phpBB® Forum Software © phpBB Group
https://www.phpbb.com/