파싱하는 부분좀 알려주세요..
카이
2023.04.01
자바를 시작한지 얼마 안됐는데.. 웹페이지를 수집해야 하는 일을 하게되었는데.. 어떻게 시작해야 할지 모르겠어요..
제가 특정 사이트 게시판 주소를 입력하면 그 게시판 LIST에 있는 제목하고 내용이 제 DB에 제목 , 내용 하나씩 분리해서 들어가는
작업을 해야하는데 앞이 캄캄하기만 하지 도저히 감이 안오네요..
부탁드리겠습니다...
-
연꽃
감사합니다.. 그런데.. 아주 간단한 소스라도 구할 수 없을까요??
자바에 지식이 너무 없다 보니 너무 어렵기만 하네요..
죄송합니다.. 작은 소스라도 알려주세요.. -
맑다
1. httpclient 로 HTML 를 받아온다.
2. HTML Parser 를 이용하여 XML 형태로 변환한다.
3. XML 에서 원하는 데이터를 추출한다.
httpclient, html parser or NekoHTML 로 검색하면 1,2 번은 해결되고..
xml 처리는 jdom 이나 java xml 로 검색해보세요.!!!