import java.io.*;
import javax.swing.text.html.*;
import javax.swing.text.html.parser.*;
public class Html2Text extends HTMLEditorKit.ParserCallback {
StringBuffer s;
public Html2Text() {}
public void parse(Reader in) throws IOException {
s = new StringBuffer();
ParserDelegator delegator = new ParserDelegator();
delegator.parse(in, this, false);
}
public void handleText(char[] text, int pos) {
s.append(text);
}
public String getText() {
return s.toString();
}
public static void main (String[] args) {
try {
// HTML a convertir
FileReader in = new FileReader("fichero.html");
Html2Text parser = new Html2Text();
parser.parse(in);
in.close();
System.out.println(parser.getText());
}
catch (Exception e) {
e.printStackTrace();
}
}
}
Si no queres usar las clases HTML del javax.swing.text.html
hacelo con una expresion regular
str = str.replaceAll("</?[A-Z]+\\b[^>]*>", "");
si lo que queres es hacerlo a puros bucles, avisa y te escribo el codigo, por que ahorita no tengo el JDK jejejejeje