Skip to main content

将存储库从 GitHub.com 迁移到 GitHub Enterprise Cloud

可以使用 GitHub CLI 或 GraphQL API 将存储库从 GitHub.com 迁移到 GitHub Enterprise Cloud。

Tool navigation

关于使用 GitHub Enterprise Importer

进行存储库迁移

可以使用 GitHub CLI 或 API 运行迁移。

GitHub CLI 可简化迁移过程,建议大多数客户使用。 具有大量自定义需求的高级客户可以使用 API 构建自己的与 GitHub Enterprise Importer 的集成。

若要查看使用 API 的说明,请使用页面顶部的工具切换器。
若要查看使用 GitHub CLI 的说明,请使用页面顶部的工具切换器。

先决条件

  • 强烈建议执行迁移的试运行,然后在不久之后完成生产迁移。 要了解试运行的详细信息,请参阅“在 GitHub 产品之间迁移的概述”。
  • 确保了解将要迁移的数据以及导入程序已知的支持限制。有关详细信息,请参阅“关于 GitHub 产品之间的迁移”。
  • 虽然并非必需,但建议在生产迁移期间停止工作。 Importer 不支持增量迁移,因此迁移期间发生的任何更改都不会迁移。 如果选择在生产迁移期间不停止工作,需要手动迁移这些更改。
  • 在源组织和目标组织中,你必须是组织所有者或被授予迁移者角色。 有关详细信息,请参阅“管理 GitHub 产品之间迁移的访问权限”。

步骤 0:准备好使用 GitHub GraphQL API

要进行 GraphQL 查询,需要编写自己的脚本或使用 HTTP 客户端(如 Insomnia)。

要详细了解 GitHub GraphQL API 入门(包括如何进行身份验证),请参阅“使用 GraphQL 建立调用”。

步骤 1:获取迁移目标的 ownerId

作为 GitHub Enterprise Cloud 中的组织所有者,请使用 GetOrgInfo 查询为要拥有已迁移存储库的组织返回 ownerId(也称为组织 ID)。 需要使用 ownerId 来标识迁移目标。

GetOrgInfo 查询

query(
  $login: String!
){
  organization (login: $login)
  {
    login
    id
    name
    databaseId
  }
}
查询变量说明
login组织名称。

GetOrgInfo 响应

{
  "data": {
    "organization": {
      "login": "Octo",
      "id": "MDEyOk9yZ2FuaXphdGlvbjU2MTA=",
      "name": "Octo-org",
      "databaseId": 5610
    }
  }
}

在此示例中,MDEyOk9yZ2FuaXphdGlvbjU2MTA= 是组织 ID 或 ownerId,在下一步中会用到它。

步骤 2:确定要从何处迁移

可以使用 createMigrationSource 查询设置迁移源。 需要提供从 GetOrgInfo 查询收集的 ownerId 或组织 ID。

迁移源是 GitHub.com 上的组织。

createMigrationSource 突变

mutation createMigrationSource($name: String!, $ownerId: ID!) {
  createMigrationSource(input: {name: $name, url: "https://github.com", ownerId: $ownerId, type: GITHUB_ARCHIVE}) {
    migrationSource {
      id
      name
      url
      type
    }
  }
}

注意:请确保将 GITHUB_ARCHIVE 用于 type

查询变量说明
name迁移源的名称。 此名称仅供你自己参考,因此可以使用任何字符串。
ownerIdGitHub Enterprise Cloud 上组织的组织 ID。

createMigrationSource 响应

{
  "data": {
    "createMigrationSource": {
      "migrationSource": {
        "id": "MS_kgDaACQxYmYxOWU4Yi0wNzZmLTQ3NTMtOTdkZC1hNGUzZmYxN2U2YzA",
        "name": "GitHub.com Source",
        "url": "https://github.com",
        "type": "GITHUB_SOURCE"
      }
    }
  }
}

在此示例中,MS_kgDaACQxYmYxOWU4Yi0wNzZmLTQ3NTMtOTdkZC1hNGUzZmYxN2U2YzA 是迁移源 ID,我们将在后面的步骤中使用。

步骤 3:开始迁移存储库

开始迁移时,单个存储库及其随附的数据将迁移到你标识的全新 GitHub 存储库。

如果要从同一源组织一次移动多个存储库,则可以将多个迁移排入队列。 最多可以同时运行 5 个存储库迁移。

startRepositoryMigration 突变

mutation startRepositoryMigration (
  $sourceId: ID!,
  $ownerId: ID!,
  $sourceRepositoryUrl: URI!,
  $repositoryName: String!,
  $continueOnError: Boolean!,
  $accessToken: String!,
  $githubPat: String!,
  $targetRepoVisibility: String!
){
  startRepositoryMigration( input: {
    sourceId: $sourceId,
    ownerId: $ownerId,
    repositoryName: $repositoryName,
    continueOnError: $continueOnError,
    accessToken: $accessToken,
    githubPat: $githubPat,
    targetRepoVisibility: $targetRepoVisibility
    sourceRepositoryUrl: $sourceRepositoryUrl,
  }) {
    repositoryMigration {
      id
      migrationSource {
        id
        name
        type
      }
      sourceUrl
    }
  }
}
查询变量说明
sourceIdcreateMigrationSource 突变返回的迁移源 id
ownerId组织在 GitHub Enterprise Cloud 上的组织 ID。
repositoryName组织在 GitHub Enterprise Cloud 上拥有的任何存储库当前未使用的自定义唯一存储库名称。 迁移完成或停止时,将在此存储库中创建一个错误记录问题。
continueOnError迁移设置,允许在遇到不会导致迁移失败的错误时继续迁移。 必须为 truefalse。 强烈建议将 continueOnError 设置为 true,以便继续迁移,除非 Importer 无法移动 Git 源,或 Importer 已断开连接且无法重新连接以完成迁移。
githubPat目标组织在 GitHub Enterprise Cloud 上的 personal access token。
accessToken源的 personal access token。
targetRepoVisibility新存储库的可见性。 必须为 privatepublicinternal。 如果未设置,则存储库将作为专用存储库迁移。
sourceRepositoryUrl源存储库的 URL,格式为 https://github.com/{organization}/{repository}

有关 personal access token 要求的信息,请参阅“管理 GitHub 产品之间迁移的访问权限”。

在下一步中,将使用从 startRepositoryMigration 突变返回的迁移 ID 来检查迁移状态。

步骤 4:检查迁移状态

要检测任何迁移失败并确保迁移正常工作,可以使用 getMigration 查询检查迁移状态。 还可以使用 getMigrations 检查多个迁移的状态。

getMigration 查询将返回状态,让你知道迁移状态是 queuedin progressfailed 还是 completed。 如果迁移失败,Importer 将提供失败原因。

getMigration 查询

query (
  $id: ID!
){
  node( id: $id ) {
    ... on Migration {
      id
      sourceUrl
      migrationSource {
        name
      }
      state
      failureReason
    }
  }
}
查询变量说明
idstartRepositoryMigration 突变返回的迁移的 id

步骤 5:验证迁移并检查错误日志

要完成迁移,建议检查“迁移日志”问题。 此问题在目标存储库中的 GitHub 上创建。

标题为“迁移日志”的问题的屏幕截图。 问题中的第二个注释包括迁移的日志。

最后,建议查看已迁移的存储库以进行完整性检查。

步骤 1:安装 GEI extension of the GitHub CLI

如果这是第一次迁移,需要安装 GEI extension of the GitHub CLI。 有关 GitHub CLI 的详细信息,请参阅“关于 GitHub CLI”。

此外,也可以从 github/gh-gei 存储库的版本页面下载一个独立的二进制文件。 可以直接运行此二进制文件,无需使用前缀 gh

  1. 安装 GitHub CLI。 有关 GitHub CLI 的安装说明,请参阅 GitHub CLI 存储库

    注意:需要 GitHub CLI 版本 2.4.0 或更高版本。 可以使用 gh --version 命令检查已安装的版本。

  2. 安装 GEI extension。

    Shell
    gh extension install github/gh-gei
    

每当需要 GEI extension 的帮助时,都可以将 --help 标志与命令一起使用。 例如,gh gei --help 将列出所有可用命令,gh gei migrate-repo --help 将列出 migrate-repo 命令的所有可用选项。

步骤 2:更新 GEI extension of the GitHub CLI

GEI extension 每周更新一次。 为了确保使用的是最新版本,请更新扩展。

gh extension upgrade github/gh-gei

步骤 3:设置环境变量

在使用 GEI extension 迁移到 GitHub Enterprise Cloud 之前,必须创建可以访问源和目标组织的 personal access token,然后将 personal access token 设置为环境变量。

  1. 创建并记录一个 personal access token (classic),用于在 GitHub Enterprise Cloud 上为目标组织进行身份验证,确保令牌满足所有要求。 有关详细信息,请参阅“管理 GitHub 产品之间迁移的访问权限”。

  2. 创建并记录一个 personal access token,用于对源组织进行身份验证的,确保此令牌也满足所有相同的要求。

  3. 为 personal access token 设置环境变量,将以下命令中的 TOKEN 替换为上面记录的 personal access token。 将 GH_PAT 用于目标组织,并将 GH_SOURCE_PAT 用于源组织。

    • 如果使用终端,请使用 export 命令。

      Shell
      export GH_PAT="TOKEN"
      export GH_SOURCE_PAT="TOKEN"
      
    • 如果使用 PowerShell,请使用 $env 命令。

      Shell
      $env:GH_PAT="TOKEN"
      $env:GH_SOURCE_PAT="TOKEN"
      

步骤 4:生成迁移脚本

如果要一次性将多个存储库迁移到 GitHub Enterprise Cloud,请使用 GitHub CLI 生成迁移脚本。 生成的脚本将包含迁移命令的列表(每个存储库一个)。

注意:生成脚本会输出 PowerShell 脚本。 如果使用的是终端,则需要以 .ps1 文件扩展名输出脚本,并安装适用于 MacLinux 的 PowerShell 才能运行它。

如果要迁移单个存储库,请跳到下一步。

生成迁移脚本

若要生成迁移脚本,请运行 gh gei generate-script 命令。

Shell
gh gei generate-script --github-source-org SOURCE --github-target-org DESTINATION --output FILENAME

如果希望脚本为每个迁移的存储库下载迁移日志,请添加 --download-migration-logs 标志。 有关迁移日志的详细信息,请参阅“访问 GitHub Enterprise Importer 的迁移日志”。

将上述命令中的占位符替换为以下值。

占位符
源组织名称
目标目标组织的名称
FILENAME生成的迁移脚本的文件名

如果使用终端,请使用 .ps1 文件扩展名,因为生成的脚本需要 PowerShell 才能运行。 可以安装适用于 MacLinux 的 PowerShell。

如果将 GEI 作为一个独立的二进制文件而不是 GitHub CLI 的一个扩展下载,则需要更新所生成的脚本,以运行此二进制文件而不是 gh gei

查看迁移脚本

生成脚本后,查看文件,并根据需要编辑脚本。

  • 如果有任何不想迁移的存储库,请删除或注释禁止相应的行。
  • 如果希望任何存储库在目标组织中具有不同的名称,请更新相应 --target-repo 标志的值。

注意:如果存储库的发布数据超过 10 GB,则无法迁移发布。 使用 --skip-releases 标志即可在不迁移发布的情况下迁移存储库。

如果将 GEI 作为一个独立的二进制文件而不是 GitHub CLI 的一个扩展下载,则需要更新所生成的脚本,以运行此二进制文件而不是 gh gei

步骤 5:迁移存储库

可以使用迁移脚本迁移多个存储库,也可以使用 gh gei migrate-repo 命令迁移单个存储库。

迁移多个存储库

要迁移多个存储库,请运行上面生成的脚本。 将以下命令中的 FILENAME 替换为生成脚本时提供的文件名。

  • 如果使用终端,请使用 ./

    Shell
    ./FILENAME
    
  • 如果使用 PowerShell,请使用 .\

    Shell
    .\FILENAME
    

迁移单个存储库

要迁移单个存储库,请使用 gh gei migrate-repo 命令。

Shell
gh gei migrate-repo --github-source-org SOURCE --source-repo CURRENT-NAME --github-target-org DESTINATION --target-repo NEW-NAME

注意:如果存储库的发布数据超过 10 GB,则无法迁移发布。 使用 --skip-releases 标志即可在不迁移发布的情况下迁移存储库。

将上述命令中的占位符替换为以下值。

占位符
源组织名称
CURRENT-NAME要迁移的存储库的名称
目标目标组织的名称
NEW-NAME希望已迁移的存储库具有的名称

如果要取消迁移,请使用 abort-migration 命令,将 MIGRATION-ID 替换为从 migrate-repo 返回的 ID。

Shell
gh gei abort-migration --migration-id MIGRATION-ID

步骤 6:验证迁移并检查错误日志

迁移完成后,建议查看迁移日志。 有关详细信息,请参阅“访问 GitHub Enterprise Importer 的迁移日志”。

建议查看已迁移的存储库以进行完整性检查。