비디오를 png파일로 포맷하여 images에 사진들을 넣고 json을 읽어서 같은 프레임에 대한 정보를 labels에 넣는다. %주의사항 (1) cap.read()를 하는순간 frame 은 첫번째순서로 넘어간다. 따라서 cap.get(1) = 1 이 되기때문에 json[0]부터읽어야하기때문에 frame을 한프레임 조정해야하는 점 (2) opencv가 (x,y,w,z)로 주어진 데이터의 정확한 좌표가 어디일까? 첫번째가 cv2.rectangle에서의 (x,y,w,z) object의 왼쪽모서리이다. 두번째가 yolov5에서의 bounding box (x,y,w,z) yolov5에서의 xy는 object의 중심이다. 따라서 cv2.rectangle에서의 (x,y,w,z)는 yolo format으로 변환하기위해..