music-dl/src/extractors/youtube.py

# -*- coding: utf-8 -*-
from __future__ import unicode_literals    # at top of module
import isodate
import youtube_dl
import logging
from googleapiclient.discovery import build
from googleapiclient.errors import HttpError
from .import baseFile
from update.utils import seconds_to_string

DEVELOPER_KEY = "AIzaSyCU_hvZJEjLlAGAnlscquKEkE8l0lVOfn0"
YOUTUBE_API_SERVICE_NAME = "youtube"
YOUTUBE_API_VERSION = "v3"

log = logging.getLogger("extractors.youtube.com")

class interface(object):
	name = "youtube"

	def __init__(self):
		self.results = []
		self.needs_transcode = True
		log.debug("started extraction service for {0}".format(self.name,))

	def search(self, text, page=1):
		if text.startswith("https") or text.startswith("http"):
			return self.search_from_url(text)
		type = "video"
		max_results = 20
		log.debug("Retrieving data from Youtube...")
		youtube = build(YOUTUBE_API_SERVICE_NAME, YOUTUBE_API_VERSION, developerKey=DEVELOPER_KEY)
		search_response = youtube.search().list(q=text, part="id,snippet", maxResults=max_results, type=type).execute()
		self.results = []
		ids = []
		for search_result in search_response.get("items", []):
			if search_result["id"]["kind"] == "youtube#video":
				s = baseFile.song(self)
				s.title = search_result["snippet"]["title"]
				ids.append(search_result["id"]["videoId"])
				s.url = "https://www.youtube.com/watch?v="+search_result["id"]["videoId"]
				self.results.append(s)
		ssr = youtube.videos().list(id=",".join(ids), part="contentDetails", maxResults=1).execute()
		for i in range(len(self.results)):
			self.results[i].duration = seconds_to_string(isodate.parse_duration(ssr["items"][i]["contentDetails"]["duration"]).total_seconds())
		log.debug("{0} results found.".format(len(self.results)))

	def search_from_url(self, url):
		log.debug("Getting download URL for {0}".format(url,))
		if "playlist?list=" in url:
			return self.search_from_playlist(url)
		ydl = youtube_dl.YoutubeDL({'quiet': True, 'no_warnings': True, 'logger': log, 'format': 'bestaudio/best', 'outtmpl': u'%(id)s%(ext)s'})
		with ydl:
			result = ydl.extract_info(url, download=False)
			if 'entries' in result:
				videos = result['entries']
			else:
				videos = [result]
		for video in videos:
			s = baseFile.song(self)
			s.title = video["title"]
			s.url = video["webpage_url"] # Cannot use direct URL here cause Youtube URLS expire after a minute.
			s.duration = seconds_to_string(video["duration"])
			self.results.append(s)
		log.debug("{0} results found.".format(len(self.results)))

	def search_from_playlist(self, url):
		id = url.split("=")[1]
		max_results = 50
		log.debug("Retrieving data from Youtube...")
		youtube = build(YOUTUBE_API_SERVICE_NAME, YOUTUBE_API_VERSION, developerKey=DEVELOPER_KEY)
		search_response = youtube.playlistItems().list(playlistId=id, part="id, status, snippet", maxResults=max_results).execute()
		self.results = []
		ids = []
		for search_result in search_response.get("items", []):
			if search_result["status"]["privacyStatus"] != "public":
				continue
			s = baseFile.song(self)
			s.title = search_result["snippet"]["title"]
			ids.append(search_result["snippet"]["resourceId"]["videoId"])
			s.url = "https://www.youtube.com/watch?v="+search_result["snippet"]["resourceId"]["videoId"]
			self.results.append(s)
		ssr = youtube.videos().list(id=",".join(ids), part="contentDetails", maxResults=50).execute()
		for i in range(len(self.results)):
			self.results[i].duration = seconds_to_string(isodate.parse_duration(ssr["items"][i]["contentDetails"]["duration"]).total_seconds())
		log.debug("{0} results found.".format(len(self.results)))

	def get_download_url(self, url):
		log.debug("Getting download URL for {0}".format(url,))
		ydl = youtube_dl.YoutubeDL({'quiet': True, 'no_warnings': True, 'logger': log, 'format': 'bestaudio/best', 'outtmpl': u'%(id)s%(ext)s'})
		with ydl:
			result = ydl.extract_info(url, download=False)
			if 'entries' in result:
				video = result['entries'][0]
			else:
				video = result
		log.debug("Download URL: {0}".format(video["url"],))
		return video["url"]

	def format_track(self, item):
		return "{0} {1}".format(item.title, item.duration)
Added prototype for a youtube extractor 2018-02-23 13:16:25 -06:00			`# -- coding: utf-8 --`
Additions to make code more compatible for py2 and py3 2018-03-04 12:29:25 -06:00			`from __future__ import unicode_literals # at top of module`
Set duration for youtube videos 2018-02-27 12:33:07 -06:00			`import isodate`
Added prototype for a youtube extractor 2018-02-23 13:16:25 -06:00			`import youtube_dl`
Added logging to almost everything here 2018-03-12 17:11:05 -06:00			`import logging`
Added prototype for a youtube extractor 2018-02-23 13:16:25 -06:00			`from googleapiclient.discovery import build`
			`from googleapiclient.errors import HttpError`
			`from .import baseFile`
Set duration for youtube videos 2018-02-27 12:33:07 -06:00			`from update.utils import seconds_to_string`
Added prototype for a youtube extractor 2018-02-23 13:16:25 -06:00
			`DEVELOPER_KEY = "AIzaSyCU_hvZJEjLlAGAnlscquKEkE8l0lVOfn0"`
			`YOUTUBE_API_SERVICE_NAME = "youtube"`
			`YOUTUBE_API_VERSION = "v3"`

Added logging to almost everything here 2018-03-12 17:11:05 -06:00			`log = logging.getLogger("extractors.youtube.com")`

Added prototype for a youtube extractor 2018-02-23 13:16:25 -06:00			`class interface(object):`
Prepare extractors for automatic importing 2018-04-01 05:11:59 -05:00			`name = "youtube"`
Added prototype for a youtube extractor 2018-02-23 13:16:25 -06:00
			`def __init__(self):`
			`self.results = []`
Specifies if results taken from an extractor interface requires VLC transcoding or can be directly downloaded in mp3 2018-02-25 04:54:18 -06:00			`self.needs_transcode = True`
Added logging to almost everything here 2018-03-12 17:11:05 -06:00			`log.debug("started extraction service for {0}".format(self.name,))`
Added prototype for a youtube extractor 2018-02-23 13:16:25 -06:00
			`def search(self, text, page=1):`
Added extraction of video links directly and playlists 2018-04-01 12:36:20 -05:00			`if text.startswith("https") or text.startswith("http"):`
			`return self.search_from_url(text)`
Added prototype for a youtube extractor 2018-02-23 13:16:25 -06:00			`type = "video"`
			`max_results = 20`
Added logging to almost everything here 2018-03-12 17:11:05 -06:00			`log.debug("Retrieving data from Youtube...")`
Added prototype for a youtube extractor 2018-02-23 13:16:25 -06:00			`youtube = build(YOUTUBE_API_SERVICE_NAME, YOUTUBE_API_VERSION, developerKey=DEVELOPER_KEY)`
			`search_response = youtube.search().list(q=text, part="id,snippet", maxResults=max_results, type=type).execute()`
			`self.results = []`
Set duration for youtube videos 2018-02-27 12:33:07 -06:00			`ids = []`
Added prototype for a youtube extractor 2018-02-23 13:16:25 -06:00			`for search_result in search_response.get("items", []):`
			`if search_result["id"]["kind"] == "youtube#video":`
			`s = baseFile.song(self)`
			`s.title = search_result["snippet"]["title"]`
Set duration for youtube videos 2018-02-27 12:33:07 -06:00			`ids.append(search_result["id"]["videoId"])`
Added prototype for a youtube extractor 2018-02-23 13:16:25 -06:00			`s.url = "https://www.youtube.com/watch?v="+search_result["id"]["videoId"]`
			`self.results.append(s)`
Set duration for youtube videos 2018-02-27 12:33:07 -06:00			`ssr = youtube.videos().list(id=",".join(ids), part="contentDetails", maxResults=1).execute()`
			`for i in range(len(self.results)):`
			`self.results[i].duration = seconds_to_string(isodate.parse_duration(ssr["items"][i]["contentDetails"]["duration"]).total_seconds())`
Added logging to almost everything here 2018-03-12 17:11:05 -06:00			`log.debug("{0} results found.".format(len(self.results)))`
Added prototype for a youtube extractor 2018-02-23 13:16:25 -06:00
Added extraction of video links directly and playlists 2018-04-01 12:36:20 -05:00			`def search_from_url(self, url):`
			`log.debug("Getting download URL for {0}".format(url,))`
			`if "playlist?list=" in url:`
			`return self.search_from_playlist(url)`
			`ydl = youtube_dl.YoutubeDL({'quiet': True, 'no_warnings': True, 'logger': log, 'format': 'bestaudio/best', 'outtmpl': u'%(id)s%(ext)s'})`
			`with ydl:`
			`result = ydl.extract_info(url, download=False)`
			`if 'entries' in result:`
			`videos = result['entries']`
			`else:`
			`videos = [result]`
			`for video in videos:`
			`s = baseFile.song(self)`
			`s.title = video["title"]`
			`s.url = video["webpage_url"] # Cannot use direct URL here cause Youtube URLS expire after a minute.`
			`s.duration = seconds_to_string(video["duration"])`
			`self.results.append(s)`
			`log.debug("{0} results found.".format(len(self.results)))`

			`def search_from_playlist(self, url):`
			`id = url.split("=")[1]`
			`max_results = 50`
			`log.debug("Retrieving data from Youtube...")`
			`youtube = build(YOUTUBE_API_SERVICE_NAME, YOUTUBE_API_VERSION, developerKey=DEVELOPER_KEY)`
			`search_response = youtube.playlistItems().list(playlistId=id, part="id, status, snippet", maxResults=max_results).execute()`
			`self.results = []`
			`ids = []`
			`for search_result in search_response.get("items", []):`
			`if search_result["status"]["privacyStatus"] != "public":`
			`continue`
			`s = baseFile.song(self)`
			`s.title = search_result["snippet"]["title"]`
			`ids.append(search_result["snippet"]["resourceId"]["videoId"])`
			`s.url = "https://www.youtube.com/watch?v="+search_result["snippet"]["resourceId"]["videoId"]`
			`self.results.append(s)`
			`ssr = youtube.videos().list(id=",".join(ids), part="contentDetails", maxResults=50).execute()`
			`for i in range(len(self.results)):`
			`self.results[i].duration = seconds_to_string(isodate.parse_duration(ssr["items"][i]["contentDetails"]["duration"]).total_seconds())`
			`log.debug("{0} results found.".format(len(self.results)))`

Added prototype for a youtube extractor 2018-02-23 13:16:25 -06:00			`def get_download_url(self, url):`
Added logging to almost everything here 2018-03-12 17:11:05 -06:00			`log.debug("Getting download URL for {0}".format(url,))`
			`ydl = youtube_dl.YoutubeDL({'quiet': True, 'no_warnings': True, 'logger': log, 'format': 'bestaudio/best', 'outtmpl': u'%(id)s%(ext)s'})`
Added prototype for a youtube extractor 2018-02-23 13:16:25 -06:00			`with ydl:`
			`result = ydl.extract_info(url, download=False)`
			`if 'entries' in result:`
			`video = result['entries'][0]`
			`else:`
			`video = result`
Added logging to almost everything here 2018-03-12 17:11:05 -06:00			`log.debug("Download URL: {0}".format(video["url"],))`
Added prototype for a youtube extractor 2018-02-23 13:16:25 -06:00			`return video["url"]`
Added logging to almost everything here 2018-03-12 17:11:05 -06:00
			`def format_track(self, item):`
			`return "{0} {1}".format(item.title, item.duration)`