OberonCore https://forum.oberoncore.ru/ |
|
Парсер Html кода https://forum.oberoncore.ru/viewtopic.php?f=35&t=4433 |
Страница 1 из 1 |
Автор: | bill [ Четверг, 15 Август, 2013 18:36 ] |
Заголовок сообщения: | Парсер Html кода |
Продолжение темы браузера тока это отдельная подтема, вот моя точка зрения http://zx.oberon2.ru/forum/viewtopic.php?f=48&t=132 , ... А сейчас по теме: Это идея пока еше не реализована , вот алгоритм будуюшего html парсера. 1. Весь тескт Html присвоить к строковой переменной 2. Найти "<html>" и "</html>" 3. Удалить эти теги 4. Остался остальной текст без этих тегов 5. Присвоить остаток к строковой переменной "уровень 2" 6. Найти "<head>" и "<\head>" 7. Удалить эти теги 8.Остался остальной текст без этих тегов 9. Присвоить остаток к строковой переменной "уровень 3" Ну как вам мояя идея ? Читая значения которые скрыты в Html , можна начать визуализацию, Тока пока для самых простых Html кодов без наваротов |
Автор: | Илья Ермаков [ Четверг, 15 Август, 2013 19:30 ] |
Заголовок сообщения: | Re: Парсер Html кода |
Батенька, Вам нужно непременно изучить методы синт. разбора. Непременно! Например, по Вирту "Построение компиляторов": http://www.ozon.ru/context/detail/id/19133384/ Потому что Вы сейчас пытаетесь, уж извините, решить задачу "с помощью лома и какой-то матери" ![]() Потом можно попробовать построить парсер для корректного XHTML (HTML, который является одновременно правильным XML). И только потом уже... Но вообще, разбор любого невалидного HTML и построение нормального DOM - это неподъёмная задача для одного человека, не работающего полный рабочий день над этим за зарплату )) Если хочется поупражняться, то можно и остановиться на уровне разбора XML... Или таки сконцентрироваться и довести до "выхода" пару-тройку проектиков поменьше (но не пытаться все сразу!!). Успехов! |
Страница 1 из 1 | Часовой пояс: UTC + 3 часа |
Powered by phpBB® Forum Software © phpBB Group https://www.phpbb.com/ |