OberonCore :: - Парсер Html кода

OberonCore https://forum.oberoncore.ru/

Парсер Html кода https://forum.oberoncore.ru/viewtopic.php?f=35&t=4433	Страница 1 из 1

Автор:	bill [ Четверг, 15 Август, 2013 18:36 ]
Заголовок сообщения:	Парсер Html кода
Продолжение темы браузера тока это отдельная подтема, вот моя точка зрения http://zx.oberon2.ru/forum/viewtopic.php?f=48&t=132 , ... А сейчас по теме: Это идея пока еше не реализована , вот алгоритм будуюшего html парсера. 1. Весь тескт Html присвоить к строковой переменной 2. Найти "<html>" и "</html>" 3. Удалить эти теги 4. Остался остальной текст без этих тегов 5. Присвоить остаток к строковой переменной "уровень 2" 6. Найти "<head>" и "<\head>" 7. Удалить эти теги 8.Остался остальной текст без этих тегов 9. Присвоить остаток к строковой переменной "уровень 3" Ну как вам мояя идея ? Читая значения которые скрыты в Html , можна начать визуализацию, Тока пока для самых простых Html кодов без наваротов

Автор:	Илья Ермаков [ Четверг, 15 Август, 2013 19:30 ]
Заголовок сообщения:	Re: Парсер Html кода
Батенька, Вам нужно непременно изучить методы синт. разбора. Непременно! Например, по Вирту "Построение компиляторов": http://www.ozon.ru/context/detail/id/19133384/ Потому что Вы сейчас пытаетесь, уж извините, решить задачу "с помощью лома и какой-то матери" Потом можно попробовать построить парсер для корректного XHTML (HTML, который является одновременно правильным XML). И только потом уже... Но вообще, разбор любого невалидного HTML и построение нормального DOM - это неподъёмная задача для одного человека, не работающего полный рабочий день над этим за зарплату )) Если хочется поупражняться, то можно и остановиться на уровне разбора XML... Или таки сконцентрироваться и довести до "выхода" пару-тройку проектиков поменьше (но не пытаться все сразу!!). Успехов!

Страница 1 из 1	Часовой пояс: UTC + 3 часа
Powered by phpBB® Forum Software © phpBB Group https://www.phpbb.com/