JSOUP è una libreria per parser html.
In questo tutorial estraiamo tutti i links presenti in questa pagina “http://news.ycombinator.com/“.
Con doc.select(“a”) otteniamo un array di links.
Per ogni link, stampiamo l’indirizzo assoluto a cui punta tramite e.attr(“abs:href”)
Parser.java
package jsoup1;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
public class Parser {
public static void main(String[] args) {try {
Document doc = Jsoup.connect("http://news.ycombinator.com/").get();
for (Element e : doc.select("a")) {
String href = e.attr("abs:href");
System.out.println("href:" + href);
}
}
catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
public class Parser {
public static void main(String[] args) {try {
Document doc = Jsoup.connect("http://news.ycombinator.com/").get();
for (Element e : doc.select("a")) {
String href = e.attr("abs:href");
System.out.println("href:" + href);
}
}
catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
Output