덕질 몇일에 걸쳐서 나만 재밌는 짓거리를 했는데

페이지 정보

profile_image
작성자캣타워 조회 143회 작성일 2025-12-13 22:55:46 댓글 4

본문

H모 사이트에서 다운로드 받은 이미지들을 압축파일로 관리하고있는데

이제 여기 파일정보를 가지고 ComicInfo.xml이라는 정보파일을 생성해서 압축파일 안에 넣어두면 라이브러리처럼 관리할 수 있다고 하더란 말이지

이걸 무식하게 전부 파일명에 쑤셔넣는게 아니라 복잡한 상세정보(태그라던가)를 관리하기 편하단게 장점인데

문제는 그걸 언제 다 직접 만들어 넣냐고 ㅋㅋㅋㅋ

프로그램 하나 잘 짜서 자동으로 돌리는게 진리 아니겠어?

내가 심지어 직업도 프로그래머인데?


그래서 어제까지 만들어둔게 복잡한 파일명에서 정보를 최대한 추출해서 만들어넣는거까지가 1차버전이었음.


그리고 오늘 외출중에 떠오른 아이디어가

어차피 갤러리 번호까지 다 가지고 있는데 인터넷도 연결되어있겠다 사이트에 직접 붙어서 태그정보까지 싹 긁어올 수 있지 않을까 ...

하는 생각이 들었고 그걸 실행해본게 저녁내내 잡아본 내용인 ㅋㅋ


일단 사이트에서 직접 정보 크롤링 하는건 안되더라. 이놈들이 워낙에 그런 정보 뽑아가는 사람들이 많으니까 어지간한건 다 막아뒀더라고.

그러다가 다른방법 없는지 GPT랑 제미나이를 갈궈서 알아낸 방법이 gallery-dl임


2826845436_1765633958.8663.png


와 전세계 개발자들이 다 달라붙어서 만들어준 다운로드툴이다~

...

직접 크롤링 하겠다고 두시간쯤 삽질했지만 아무튼 좋은거 찾았으니 좋았쓰 

2826845436_1765634028.1149.jpg


아무튼 덕분에 무사히 히X미 파일들 태그정보를 찾아서 집어넣었다는 이야기.


지금부터는 짜둔 프로그램 돌려야하는데, 하드디스크에 관리하다보니까 대충 하나 정보추출하고 데이터 로드하고 압축파일 다시 만들어 써넣는데 개당 3초정도 걸리거든?

라이브러리 3만개 넘어가니까 예상시간으로 25시간 잡아주더라.

일은 뭐 컴퓨터가 하겠지 나는 그사이에 딴거하고 놀아야지 ㅋ 

댓글목록

리뉴아님의 댓글

profile_image 리뉴아 작성일
방주다 방주

캣타워님의 댓글의 댓글

profile_image 캣타워 원글 작성일
거의 광고없는 히토X 취급 받고있는중

마이벙커님의 댓글

profile_image 마이벙커 작성일
나도 십년쯤 전에 http://www.sankakucomplex.com/ 기사랑 갤러리를 크롤러 만들어서 하드에 싹 퍼담았었지.. 동영상까지...

근데 언제부턴가 시벌 게이영상이랑 쉬메일영상이 올라오더니.. -ㅅ-

캣타워님의 댓글의 댓글

profile_image 캣타워 원글 작성일
앗 아앗...
전 야오이태그랑 남성온리 태그 막아두고 사용해서 ㅠㅠ
전체 6,243건 15 페이지
게시물 검색