Hoe kan ik HTML exporteren naar tekst

exporteren HTML naar tekst is een eenvoudig als moeizaam proces.HTML-bestanden zijn tekstbestanden met een .html of .htm extensie.Er zijn verschillende manieren om HTML te verwijderen en de tekst van de webpagina te behouden.De HTML labels moeten worden uit het bestand verwijderd.Third party software kan het bestand van de HTML-tags strip;een gebruiker kan de labels verwijderen in een teksteditor of de tekst te kopiëren vanuit een browser en plakken zonder opmaak in een teksteditor.

wat je

  • tekst editor
  • HTML-bestand
  • Need
    Browser
  • HTML strippen software

Kopieer en plak de tekst

  1. Open het HTML-bestand in de browser door te klikken op "File" en "Open File."

  2. Selecteer de tekst door te klikken op de pagina en het slepen van de cursor over de tekst om de tekst te markeren.Druk op "Ctrl-C" ("Cmd-C 'op een Mac) om de tekst te kopiëren.

  3. Open de teksteditor, zoals Kladblok in Windows of Teksteditor in Mac OS X. Klik op "Edit" en kies "plakken

    ."Een simpele tekstverwerker zoals Kladblok automatisch strippen van de HTML-tags uit de tekst.Echter, als u gebruik maakt van een meer krachtige tekstverwerker als uw tekstverwerker zoals Word, dan moet u kiezen voor "Plakken speciaal" en plak als platte tekst of "alleen tekst" om de opmaak te verwijderen.

Met software van derden

  1. Download de software van derden van uw keuze dat de HTML-tags strips uit de tekst.Zie de Resource links voor een aantal suggesties.

  2. Open het bestand in de software van derden.Afhankelijk van de software, kan het nodig zijn om het bestand te openen met behulp van "File" en "Open" om het bestand te openen.Sommige software kan hebben klikt u op "Browse" om het bestand te laden voor het exporteren.

  3. Klik op "OK" of "Opslaan" of "Convert," afhankelijk van de software, om de conversie te starten.

Verwijder de Tags in een teksteditor

  1. Open het bestand in een teksteditor door te klikken op "File" en "Open."

  2. Zoek de & lt; body & gt;tag in het bestand.Verwijdert alles van de & lt; body & gt;tag up.Deze informatie is de browser het parseren voor het bekijken en is geen onderdeel van de tekst.

  3. Zoek de & lt; / body & gt;tag in de buurt van de bodem van het document.Verwijder deze en eventuele labels eronder.

  4. Verwijder alle woorden en code tussen minder dan (& lt;) en groter dan (& gt;) symbolen en de symbolen zelf.Dit zijn de HTML-tags.Als uw tekst editor heeft een zoeken en vervangen in het menu "Edit", zoeken naar "& lt; * & gt;"en vervangen door een leeg veld.Het sterretje is een wildcard dat alle tekst tussen de twee symbolen zal dekken.

Resources

  • Nirsoft: HTMLAsText v1.11
  • World Wide Web Consortium: Het omzetten van HTML
641
0
0
Webontwikkeling