Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Интернет » В помощь вебмастеру » Вырезать текстовые блоки из html

Модерирует : Cheery

 Версия для печати • ПодписатьсяДобавить в закладки

Открыть новую тему     Написать ответ в эту тему

vell



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Откопал в архиве копию раздела стааарого веб-сайта. Сверстано на таблицах <td>.
В таблице текст. Страниц с этими таблицами около 100.  
 
Как выдрать содержимое текста таблиц этих в отдельный Файл (лучше в WORD) и не сойти с ума?
 
Чем автоматизировать? Хоть как-то?

Всего записей: 600 | Зарегистр. 06-10-2004 | Отправлено: 18:10 17-04-2019
Mavrikii

Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vell

Цитата:
Хоть как-то?

ворд умеет открывать html сам. иначе можно любой регуляркой вытащить содержимое, вырезать лишние теги, правда выглядеть может будет не так, как ожидаете. можно не регуляркой, а подключив скрипт, который вытащит текстовое содержание, но есть небольшая проблема с подключением его во все файлы.

Всего записей: 15108 | Зарегистр. 20-09-2014 | Отправлено: 19:58 17-04-2019 | Исправлено: Mavrikii, 19:59 17-04-2019
vell



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Mavrikii так речь о сотне файлов идет. Это называется "парсить"? Это же делают ведь как-то!

Всего записей: 600 | Зарегистр. 06-10-2004 | Отправлено: 21:20 17-04-2019
Mavrikii

Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vell

Цитата:
так речь о сотне файлов идет

и? стандартными средствами я не знаю как, просто написал бы скрипт который перебирал бы файлы и вытаскивал регуляркой или как сказал то, что нужно

Всего записей: 15108 | Зарегистр. 20-09-2014 | Отправлено: 21:48 17-04-2019
vell



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Mavrikii
зайду с другого угла, в чем пишут скрип, кроме всяких грандиозных Visual Studio?
Есть что крайне простое но понятнео и действенное для такого рода задач?

Всего записей: 600 | Зарегистр. 06-10-2004 | Отправлено: 08:14 18-04-2019
Mavrikii

Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vell

Цитата:
в чем пишут скрип, кроме всяких грандиозных Visual Studio?  
Есть что крайне простое но понятнео и действенное для такого рода задач?

любой язык, проще скриптовый. python, perl, php, можно даже на чистом js сварганить.
можно даже обычным grep вытащить в linux системе или команде портированной в винду.
можно этим JGsoft RegexBuddy / RegexMagic

Всего записей: 15108 | Зарегистр. 20-09-2014 | Отправлено: 21:27 18-04-2019
dneprcomp



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vell

Цитата:
кроме всяких грандиозных Visual Studio

А есть еще маленькая бесплатная Visual Studio Express

Всего записей: 3920 | Зарегистр. 31-03-2002 | Отправлено: 03:33 19-04-2019
Открыть новую тему     Написать ответ в эту тему

Компьютерный форум Ru.Board » Интернет » В помощь вебмастеру » Вырезать текстовые блоки из html


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru