Ayuda con programa en JAVA. Porfavor!!...

timoneyti

Bovino maduro
#1
Hola compañeros bakunos, eh estado tratando de elaborar un programa que me obtenga solamente ciertas cosas de una pagina, en este caeo la pagina de la cual necesito extraer la información es la siguiente:
http://fiunam.superforo.net
Se que algunos me duran lo siguiente: "Pues obtén la información solamente copiando y pegando en un archivo txt manualmente, pagina por pagina"
Lo que ocurre es que necesito que obtenga todos los comentarios de un subforo de la pagina, y hacerlo manualmente me tomaría semanas o meses.
Lo que llevo del programa es lo siguiente.

Código:
/*
 * To change this license header, choose License Headers in Project Properties.
 * To change this template file, choose Tools | Templates
 * and open the t*/
/*

/*
 *@author IVG
 *
*/

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;
public class LeerHTML {
public static void main(String[] args) {
URL urlObject;
String codigo;
try{
urlObject = new URL("http://fiunam.superforo.net/t14p15-estructuras-discretas");
InputStreamReader isr=new InputStreamReader(urlObject.openStream());
BufferedReader br=new BufferedReader(isr);
while((codigo=br.readLine())!=null)
System.out.println(codigo);
br.close();
} catch (MalformedURLException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
}
En otro código implemento archivos y un ciclo for para que lo haga con cada subpagina del subforo

Hasta el momento lo que me obtiene es el código HTML de paginas pero yo únicamente requiero que me entregue el texto que se encuentra en los comentarios del foro.
Si no me equivoco en la siguiente etiqueta se encuentran alojados, jaja bueno según yo jejeje:chin!:

La verdad no estoy 100% seguro en que parte de la etiqueta estén alojados los coments. en el foro

Código:
 <div class="content clear fix">


Alguna sugerencia o propuesta para obtener solamente los comentarios del foro, ya que específicamente requiero todos los comentarios de los subforos, y no todo el HTML como lo hace el programa.
Para que corran correctamente el programa por si gustan probarlo, necesitaran registrarse en el superforo.

En otro programa tengo la parte que me guarda el html en una pagina

EL IDE que emplee para compilar y ejecutar el codigo es Netbeans.


Ojala me ayuden que no soy muy bueno en java .
Saludos bakunos...
:D:D:D
 
Arriba