Вырезать текст из строки

Тема в разделе "Iskra JS, Espruino, Йодо", создана пользователем null, 15 апр 2018.

  1. null

    null Гик

    Wi-fi модуль скачивает html страницы целиком:
    HTML:
    <html>
    <body>
    <p> Text </p>
    </body>
    </html>
    Этот код записывается в переменную html_data. Как убрать все теги и оставить только текст, чтобы он отображался так:
    Код (Text):
    Text
    ??
     
  2. mcureenab

    mcureenab Гуру

    Тупо substr не подойдёт?
     
  3. null

    null Гик

    Если это правильно:
    То не подойдет, я же не знаю сколько символов надо взять.
     
  4. mcureenab

    mcureenab Гуру

    indexOf("<p>")

    indexOf("</p>")
     
    sys и null нравится это.
  5. sys

    sys Злобный Буратино

    вы хотите парсер html? :) Все зависит от того насколько сложна скачиваемая страница... Можно поиграть с регулярными выражениями http://www.espruino.com/Reference#t_RegExp
     
  6. mcureenab

    mcureenab Гуру

    Для JavaScript есть парсеры HTML. Они преобразуют пооский текст с тэгами в структуру данных JavaScript. Но это тяжелая артиллерия. Если структура обрабатываемых HTML документов проста и статична, indexOf и substr будет достаточно.

    Иногда можно не выделять "Text" из документа, а функцией indexOf поискать образец в плоском тексте.