YouTube Video Scraper - Web Scraping YouTube Video Data

{
    "downloadSubtitles": false,
    "preferAutoGeneratedSubtitles": false,
    "proxyConfiguration": {
        "useApifyProxy": true
    },
    "saveSubsToKVS": false,
    "simplifiedInformation": false,
    "startUrls": [
        {
            "url": "https://www.youtube.com/watch?v=oxy8udgWRmo"
        }
    ],
    "verboseLog": false
}

{
    "downloadSubtitles": false,
    "maxResults": 10,
    "preferAutoGeneratedSubtitles": false,
    "proxyConfiguration": {
        "useApifyProxy": true
    },
    "saveSubsToKVS": false,
    "searchKeywords": "terminator dark fate trailer",
    "simplifiedInformation": false,
    "verboseLog": false
}

{
  "title": "Terminator: Dark Fate - Official Trailer (2019) - Paramount Pictures",
  "id": "oxy8udgWRmo",
  "url": "https://www.youtube.com/watch?v=oxy8udgWRmo",
  "viewCount": 19826925,
  "date": "2019-08-29T00:00:00+00:00",
  "likes": 144263,
  "dislikes": null,
  "location": "DOUBLE DOSE CAFÉ",
  "channelName": "Paramount Pictures",
  "channelUrl": "https://www.youtube.com/c/paramountpictures",
  "numberOfSubscribers": 2680000,
  "duration": "2:34",
  "commentsCount": 25236,
  "details": "<span dir=\"auto\" class=\"style-sco..."
}

async ({ item, page }) => {
    // add more info, in this case, the shortLink for the video
    const shortLink = await page.evaluate(() => {
        const link = document.querySelector('link[rel="shortlinkUrl"]');
        if (link) {
            return link.href;
        }
    });
    return {
        ...item,
        shortLink,
    }
}

async ({ page, request, requestQueue, customData, Apify }) => {
    if (request.userData.label === 'DETAIL' && !request.userData.isRelated) {
        await page.waitForSelector('ytd-watch-next-secondary-results-renderer');
        const related = await page.evaluate(() => {
            return [...document.querySelectorAll('ytd-watch-next-secondary-results-renderer a[href*="watch?v="]')].map(a => a.href);
        });
        for (const url of related) {
            await requestQueue.addRequest({
                url,
                userData: {
                    label: 'DETAIL',
                    isRelated: true,
                },
            });
        }
    }
}

import { ApifyClient } from 'apify-client'; // Initialize the ApifyClient with API token const client = new ApifyClient({ token: '<YOUR_API_TOKEN>', }); // Prepare actor input const input = { "searchKeywords": "Crawlee", "maxResults": 10, "maxResultsShorts": 10, "maxResultStreams": 10, "extendOutputFunction": async ({ data, item, page, request, customData }) => { return item; }, "extendScraperFunction": async ({ page, request, requestQueue, customData, Apify, extendOutputFunction }) => { }, "customData": {}, "handlePageTimeoutSecs": 3600, "proxyConfiguration": { "useApifyProxy": true, "apifyProxyCountry": "US" } }; (async () => { // Run the actor and wait for it to finish const run = await client.actor("bernardo/youtube-scraper").call(input); // Fetch and print actor results from the run's dataset (if any) console.log('Results from dataset'); const { items } = await client.dataset(run.defaultDatasetId).listItems(); items.forEach((item) => { console.dir(item); }); })();

from apify_client import ApifyClient # Initialize the ApifyClient with your API token client = ApifyClient("<YOUR_API_TOKEN>") # Prepare the actor input run_input = { "searchKeywords": "Crawlee", "maxResults": 10, "maxResultsShorts": 10, "maxResultStreams": 10, "extendOutputFunction": """async ({ data, item, page, request, customData }) => { return item; }""", "extendScraperFunction": """async ({ page, request, requestQueue, customData, Apify, extendOutputFunction }) => { }""", "customData": {}, "handlePageTimeoutSecs": 3600, "proxyConfiguration": { "useApifyProxy": True, "apifyProxyCountry": "US", }, } # Run the actor and wait for it to finish run = client.actor("bernardo/youtube-scraper").call(run_input=run_input) # Fetch and print actor results from the run's dataset (if there are any) for item in client.dataset(run["defaultDatasetId"]).iterate_items(): print(item)

# Set API token API_TOKEN=<YOUR_API_TOKEN> # Prepare actor input cat > input.json <<'EOF' { "searchKeywords": "Crawlee", "maxResults": 10, "maxResultsShorts": 10, "maxResultStreams": 10, "extendOutputFunction": "async ({ data, item, page, request, customData }) => {\n return item; \n}", "extendScraperFunction": "async ({ page, request, requestQueue, customData, Apify, extendOutputFunction }) => {\n \n}", "customData": {}, "handlePageTimeoutSecs": 3600, "proxyConfiguration": { "useApifyProxy": true, "apifyProxyCountry": "US" } } EOF # Run the actor curl "https://api.apify.com/v2/acts/bernardo~youtube-scraper/runs?token=$API_TOKEN" \ -X POST \ -d @input.json \ -H 'Content-Type: application/json'

{ "searchKeywords": "Crawlee", "maxResults": 10, "startUrls": [], "simplifiedInformation": false, "saveShorts": false, "maxResultsShorts": 10, "saveStreams": false, "maxResultStreams": 10, "maxComments": 0, "subtitlesLanguage": "en", "extendOutputFunction": "async ({ data, item, page, request, customData }) => {\n return item; \n}", "extendScraperFunction": "async ({ page, request, requestQueue, customData, Apify, extendOutputFunction }) => {\n \n}", "customData": {}, "handlePageTimeoutSecs": 3600, "proxyConfiguration": { "useApifyProxy": true, "apifyProxyCountry": "US" } }

By APIs

Ecommerce Scraping API

Food Scraping API

Grocery Scraping API

Travel Scraping API

Real Estate Scraping API

Quick Commerce Scraping API

Social Media Scraping API

OTT Scraping API

Liquor Scraping API

Recruitment Scraping API

Healthcare Scraping API

Web Data

Solutions

Web Scraping Services

Web Scraping API Services

Mobile App Scraping services

Enterprise Web Crawling

Solutions

Web Unlocker API

Anti Blocking

Use Cases

Live Crawler

Scraping Browser API

Trending

Ecommerce

Grocery / Quick Commerce

Food

Travel

Get Free Quote

Unlock Business Growth with Trusted Web Data

YouTube Video Data Scraper - YouTube Video Data Collection

RealdataAPI / youTube-video-data-scraper

What is YouTube Video Data Scraper and How Does it Work?

How to Scrape Video Data from YouTube?

Why Scrape YouTube Video Data?

Can I Scrape YouTube Video Data Legally?

What is the cost of using YouTube Video Data Scraper?

Do I Need to Use Proxy Server to Scrape YouTube Data?

Input Parameters of YouTube Video Data Scraper

Data scraping from YouTube Videos by URL

Scraping YouTube Video Data Using Search Queries

Output Sample of YouTube Scraper

Important Notes to Customize the YouTube Data Scraper

Do you need to scrape other social media and video data?

YouTube Video Scraper with Integrations

Using YouTube Video Scraper with the Real Data API Actor

Share Your Feedback

Related Scrapers

Facebook Ads Data Scraper

Twitter Scraper

Instagram Profile Data Scraper

Search Term

Maximum Search Results

Direct URLs

Only Collect Basic Channel Information

Save Short Videos

Maximum Shorts Videos

Save Streams

Maximum Streams

Maximum Comments

Download Subtitles

Store Video Subtitles to Key-Value Store

Subtitle Language

Choose Autogenerated Subtitles

Extend Output Function

Extend Scraper Function

Custom Data

Handle Page Timeout

Proxy Configuration

Verbose Log

ON THIS PAGE